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Vp until now, a central and global unit 
have been integrated into one module which 
processes tSl qf the configuration requests. The. . 
invention provides for. a olurality of active units 
which can take over ^is task. These units 
are arranged in a hierarchy. A request from 
the lowest level iM>nly transferred to the next 
highest level if d» request cannot be processed. 
The highest level is connected to an internal 
or external higher-order configuration m^noiy 
which contains all the configuration data tva 
requhed for this programme run. The tree 
structure of the configuration units enables a 
kind of cacheing (^thc configuration data. The 
configurations are mainly accessed locally. In 
the worst case scenario, a configuration has to 
be loaded from die higher-oider configuration 
memory in case the relative data are not available in any of the CT^ (configuration tables) in die hierarchy. 
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Anstatt wie bisher eine zentiale und globale Einhcit in einen Baustein zu integrieren, welche alle Konfiguiations-Anfoideiungen 
bearbeitet. exislicren nun cine Mehrz^l yon hierarchiscb langeprdneten aktiyen Einhciten, welche dicsc Aufgabe ubemehmen kdnneiL 
I>abei wild eihc Anfoidenmg vcm dcr tiefsten Ebene nur dann aii die hachst h6her gelegenc Ebene weitcrgeleitet, wenn die 
Anfoidenmg nicht beaibeitet weiden kornite. Die hdchst gelegenc Ebene ist an einen intemcn odcr extemen flbergcordneten 
Kcmfigurationsspeichef ahgeschlc^^ der die jemals fUr dieseh Pirogrammlauf bendtigten Konfigurationsdaten enthait Dmch die 
Baumstruktur der Konfigmadohseinheiten wird eine Ait Cacheing der Konfigurationsdaten eneicht. Zugriffe auf Konfiguiationen finden 
haupts9chlich lokal statt Im ungOnstigsten Fall muss eine Konfiguration aus dem Obergcordnetcn Konfigurationsspeicher geladen werden, 
falls die betreffenden Daten in keiner der hieimchisch angeordnetcn CTs vortia^ 
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Verfahren zum hierarchischen Cachen von 
Konfigurationsdaten von Datenflufiprozessoren und 
Bausteinen mit zwei- oder mehrdimensionaler 
programmierbarer Zellstruktur (FPGAs, DPGAs, o. dgl.). . 

Hintergrund der Erfindung 
Stand der Technik 

Der Stand der Technik, welcher diese Patentschrift 
zugrunde liegt, ist durch die Patentanmeldung 196 54 
846.2-53 (Verfahren ziim selbstandigen dynaraischen 
Umladen von Datenf luBprozessoren (DFPs) sowie Bausteinen 
mit zwei- oder mehrdimensionaler programmierbaren 
Zellmatrix (FPGAs, DPGAs, o.dgl.) und der 
Patentanmeldung 196 54 593.5-53 (Umkonf igurierungs 
Verfahren fiir programmierbare Bausteine zur Laufzeit) 
beschrieben. Darin wird ein Verfahren zur Konf iguration 
un<l Umkonf iguration. von DFPs, sowie FPGAs, DPGAs und 
ahnlichen Bausteinen nach dem Stand der Technik, 
beschrieben, be i dem ein separat ausgestalteter zentral 
ubergeordneter Mikrokontroller-ahnlicher Bausteiri die 
Verteilung von Konfigurationsdaten an mehrere 
untergeordnete, weitgehend passive Steuereinheiten 
ubernimmt • 

Probleme 

Durch den Einsatz einer zentralen und globalen Einheit, 
welche die Rekonf iguration von Teileri (z.B. Zellen 
(CELs)) eines oder mehrerer Bausteine steuert, kommt es 
zu Engpassen, wenn viele verschiedene Rekonf igurations- 
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Anfragen auf einmal behandelt werden mussen. Die 
Vorteile der P'arallelitMt, der beschriebenen Bausteine, 
Wird durch eine solche zentrale Einheit stark 
eingeschrankt/ da sie deri typischeh "Flascherihals" " 
darstellt und die Verarbeitung der Paten dadurch. 
erheblich verlangscunt . 

Weiterhin ist die Zuordnung der Ereignisquelle zu der zu 
ladenden Konfiguration problematisch, da mit absoluten 
Adressen des. Konf igurationsspeichers gearbeitet wird. 
Die Rekonfiguratiohs-Einheit mufi also eine Art 
Speicherverwaltungssystera beinhalten, welche, ahnlich 
wie in einem Betriebssystem, mitprotokolliert , welche 
Speicherbereich von welcher Konfiguration benutzt 
: werden. 

Ein zusatzliches Problem stellt die Verwaltung der 
Resourcen (z.B* CELs) dar. Es mufi sichergestellt sein, 
daB jede CEL nur genau einmal an einen von einer 
Rekonfigurationsanfrage gestartetem Algorithmus vergeben 
wird und zwar denjenigen der auch die restlichen 
umliegenden CEL verwendet, da ansonsten Deadlocks 
auftreten konnen. 

Urn die Problematik der Umkon figuration nochmals zu 
verdeutlichen wird folgendes Beispiel gegeben: 
Eine Matrix aus CELs ist unkonf iguriert und im RESET- 
Zustand. Jede CEL ist in der Lage anzuzeigen, ob sie 
s.ich in einem umkonfigurierbaren Zustand befindet. Alle. 
CELs in der Matrix sind bereit konfiguriert zu werden; 
befinden sich also in einem umkonfigurierbaren Zustand. 
Eine erste Konf igurationsroutine (KRl) wird geladen, 
wobei die Matrix nicht vollstandig benutzt wird. Die 
konfigurierten CELs heben die Anzeige, daii sie sich in 
einem konf igurierbaren Zustand befinden auf. In eine 
Gruppe der noch nicht konfigurierten CELs wird eine 
zweite, von der Ersten unabhangigen, 
Konf igurationsroutine (KR2) geladen. Eine dritte 
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Konfiguration kann nicht geladen werden, da diese CELs 
der ersten und/oder zweiten Konf igurationsroutine (KR3) 
benotigt, die sich aber in keinem umkonf igurierbaren 
Zustand bef indeh, da sie benutzt • werden, 
KR3 mui5 so lange angehalten werden, bis die benotigten . 
CEL freigegeben wurden, d.h. KRl und KR2 terminiert 
haben . 

Wahrend der Ausfuhrung von KRl und KR2 kommt eine 
Ladeanforderung fur eine vierte Konf igurationsroutine 
(KR4). und eine funfte Konf igurationsroutine (KR5.) hinzu, 
die alle nicht sofort geladen werden konnen, da sie CELs 
benutzen,. die von KRl und KR2 verwendet werden. KR3 und 
KR4 benutzen teilweise die selben CELs,. KR5 benutzt 
keine der CELs von KR3 und KR4. 

Urn KR3-5 ordentlich nachzuladen existieren folgende 
Forderungen: 

1. KR3~5 sollen so geladen werden, dafi die zeitliche 
Reihenfolge geraafi den Ladean forderungen moglichst 
beibehalten wird. 

2. MSglichst viele KR die unabhangig von einander sind, 
also keine gemeinsamen CELs besitzen, sollen geladen 
werden, urn ein Hochstmafi an Parallelitat zu erhalten. 

3. Die KRs diirfen sich nicht gegenseitig blockieren, 
d,h, KR3 ist teilweise geladen, kann jedoch nicht weiter 
geladen werden, da andere CELs durch die teilweise 
geladene KR4 blockiert sind; wahrend KR4 auch nicht 
weiter geladen werden kann, da wiederum benotigte CELs 
durch KR3 blockiert sind. Dies fiihrt zu einer typische 
Deadlock-Situation . 

4. Dem Compiler, der die KRs generiert hat ist es nicht 
moglich das zeitliche Zusainmenspiel der KRs zu erkennen 
und so auf zulosen, dafi es zu keiner Konf liktsituatibn . 
konrmt . 
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Dabei soil das Verhaltnis zwischen den Aufwand fiir eine 
zu realisierende Schaltung und eines pptimalen 
Ergebnisses moglichst gut sein, d.h. Ziel der Erfindung 
ist es mit moglichst gerihgem Aiafwand eirie flexible, 
.parallele, Deadlock-freie Konfiguration zu;erm6glichen,: 
die mit wenig Zeit- und Rechenaufwand durchgefuhrt 
warden kann. Dabei miissen folgende Grundprobleme gelost 
werden: 

- Wiirde nur KR3 geladen werden, ware das Verfahren 
Deadlock-frei,. dbch nicht optimal, .da auch .KR5 geladen 
werden konnte. 

- Wird KR3 geladen, KR4 nicht, jedoch KR5 mufi KR4 so 
vorgemerkt werden, dafi es bei einem nachfolgenden 
Ladevorgang die hochste Prioritat besitzt, was eihen 
hohen Verwaltungsauf wand bedeutet . 

Die Deadlockfreiheit ist durch das nachfolgend 
beschriebene Verfahren gegeben: 

Verbesserung durch die Erfindting, Aufgabe 

Die Grundaufgabe der vorliegenden Erfindung ist eine 
Einheit - im folgenden Konf igurationstabelle (CT) 
genannt die hierarchisch aufgebaut ist und auf jeder 
Ebene mehrfach vorkommen kann, wobei sich die Zahl der 
CTs von der untersten Hierarchiestufe zur obersten so 
verringert, daB auf der hSchsten Ebene genau eine CT 
vorhanden ist. .Jede GT konf igiiriert und kontrollxert 
unabhangig von anderen und parallel eine Mehrzahl von 
konfigurierbaren Elementen (CELs) . CTs hoherer 
Hierarchiestufen konnen Konf igurationsroutinen fur 
tieferliegende CTs zwischenspeichern . Benotigen mehrere 
der tieferliegenden CTs ein und dieselbe 
Konfigurationsroutine, wird diese bei einer 
hoherliegenden CT zwischengespeichert und von den 
einzelnen CTs abgerufen, wobei die hoherliegende CT die 
betreffende Konfigurationsroutine nur ein Mai aus einem 
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globalen gemeinsamen Konf igurationsspeicher abruft, 
wodurqh eiri Cache-Eff^kt* erzi 

konfigurierbarer Bausteine kann die vorliegende 
Erfindiing als Gacheverfahren fur Instruktions-^ und 
Datencache in Mikroprozessoren, . DFP oder dg.l. mit 
mehreren Rechenwerken eingesetzt warden. Dabei konnen, 
je nach Anwendung, einige der im folgenden beschriebenen 
Einheiten entfallen (z.B. FILMO) , am hierarchischen 
Aufbau andert sich jedoch grundlegend nichts. Deshalb 
wird dieser Einsatz als eine Teilmenge betrachtet und 
nicht weiter darauf eingegangen. Ein erheblicher Vorteil 
des beschriebenen Verfahrens gegeniiber gewohnlichen 
Gacheverfahren ist, dafi Daten und/oder Code selektiv, . 
d.h. anhand von exakt auf den Algorithmus abgestiinmten 
Methoden gecached werden. 

Ebenfalls ermoglicht die vorliegende Erf indung das 
vollstandig deadlockf reie Umkonf igurieren von groBen 
Zellstrukturen . 

Beschreibung der Erfindung 

Anstatt wie bisher eine zentrale und globale Einheit in 
einen Baustein zu integrieren, welche alle 
Konfigurations-Anforderungen bearbeitet, exist ieren nun 
eine Mehrzahl von hierarchisch (Baumstruktur) 
angeordneten aktiven Einheiten, welche diese Aufgabe 
tibernehmen konnen. 

Dabei wird eine Anforderung von der tiefesten Ebene (den 
Blattern in der Hierarchie) nur dann an die nSchst hoher 
gelegene Ebene weitergeleitet, wenn die Anforderung 
nicht bearbeitet werden konnte. Diese Schritte werden 
fur alle vorhandenen Ebenen wiederholt, bis die hochst 
gelegene Ebene erreicht ist. 

Die hochst gelegene Ebene ist an einen internen oder 
externen Qbergeordneten Konf igurationspeicher 
angeschlossen, der alle jemals fiir diesen Programlauf, 
benotigten Konf igurationsdaten enthalt. 
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Durch die Baumstruktur der Konf igurationseinheiten wird 
eine Art Cacheing der Kbnf igurationsdaten erreicht- 
Zugriffe auf Konf igurationen finden hauptsachlich lokal 
statt . Im ungiiristigsten Fall muss 'eine' Konf iguration aus 
den iibergeordneten Konf igurationsspeicher geladen 
werden, falls die betreffenden Daten in keiner der 
hierarchisch angeordneten CTs vorhanden sind. 
Deadlocks werden verhindert, indem eine feste zeitliche 
Abfolge der zu ladenden Konf igurationen eingefuhrt wird 
und die Konf igurationen zu. einer Liste zusammengefaiit 
werden. Die Statusinf ormationen der CEL werden vor dem 
^.Laden ge si chert, und bleiben dadurch wahrend des 
Abarbeitens der. gesamten. Liste von Konf igurationen 
unVerandert . 

Die Grundlagen der CT 

Eine Konf igurationstabelle (CT) ist eine aktive Einheit, 
die auf Synchronisationssignale, sogenannten Trigger, 
reagiert. Die Trigger werden von einer zwei- oder 
mehrdimensionalen Matrix aus elektronischen Baugruppen, 
fur gewohnlich arithmentischen oder logischen Einheiten, 
Adressgeneratoren, Recheneinheiten, o.a. - im folgenden 
konfigurierbare Elemente (CEL) genannt - generiert. 
Anhand d^s auftretenden Trigger wird eine bestimmte 
Aktion innerhalb der CT ausgelost. Dabei ist es Aufgabe 
der GT die Steuerung einer Mehrzahl von CELs zu 
ubernehmeh und deren arithnietischen .und/.oder logischen . 
Operationen zu bestimmen. Insbesondere mussen CELs 
konfiguriert und umkonf iguriert werden. Diese Aufgabe 
tibernimmt eine CT, indem sie eine Mehrzahl von moglichen 
Konfigurationsroutinen (KR) , die ihrerseits jeweils aus 
einer Mehrzahl von einzelnen Konf igurationsworten (KW) 
bestehen, verwaltet und eine Mehrzahl von CELs aufgrund 
von Triggerbedingungen mit einer oder mehrerer der KR 
konfigurieren. Dabei erhalt eine CEL jeweils eines Oder 
mehrere der Konf igurationsworte, die mit der Adresse der 
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zu konfigurierenden CEL versehen sind. Eine KR iriufi dabei 
vollstandig und korrekt auf eine Mehrzahl von CELs 
abgebildet werden, wobei mehrere CELs zu Gruppen 
zusamitiengef alit sein konnen; die mit jeweils ■ " " 
unterschiedlichen, aber . vollstandig ausgefiihrten KRs 
konfiguriert werden. Dabei sind alle CELs in einer 
Gruppe so verschaltet, dal5 nach Feststellung einer 
notwendigen Umkonf igurierung alle gruppierten CELs durch 
ein gemeinsaines Signal (ReConfig) mitgeteilt wird, daB 
jede CEL die Datenverarbeitung zu beenden. und in eine.n. 
umkonf igurierbaren Zustand iiberzugehen hat, 

Grundlagen der deadlockfreien Umkonf igur at ion 

Bei zur Laufzeit umkonf igurierbaren Systemen tritt das 
Problem auf, daS> das System in einen Zustand gelangen 
kann, in dem jeweils zwei Telle aufeinander warten und 
somit eine Deadlock Situation eingetreten ist. 

Dieses Problem konnte vermieden werden, indem eine neue 
Konfiguration immer nur ganz oder gar nicht in das 
System geladen wird, oder eine Art Timeout-Verf ahren 
eingesetzt wird. 

Dadurch entstehen ein Reihe von Nachteilen (benotigter 
Platz, Laufzeit etc) und Problemen, wie zum Beispiel: 

- Vorgehen, falls eine Konfiguration nicht geladen 
werden kann. ' ■ 

- Verwaltung der Reihenfolge, in der die Konf igurationen 
geladen werden 

- Performance Einbruch, da andere Konf igurationen, 
welche eventuell in die CELs geladen werden konnten, 
nicht beachtet werden. 

Mit dem folgend beschriebenen Verfahren kSnnen diese 
Probleme beseitigt werden. Es wird von einem DFP System 
nach dem Stand der Technik ausgegangen. 
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Von einer CEL aus, wird ein Trigger-Signal an eine CT 
gesendet. Diese CT stellt die Triggerquelle fest und 
wahlt dureh eine .Look-Up Tabeile eirie zu ladende • 
Konf iguration (KR) aus. Die eingehenden Triggersignale • 
werden gesperrt, es werden keine weiteren Trigger bis 
2ur kompletten Abarbeitung der aktuellen Konf iguration 
akzeptiert. Eine Konf iguration besteht aus mehreren 
Befehlen, welche an eine Menge von CELs iibertragen wird. 
In einem zur Lauf zeit konf igurierbaren System ist 
allerdings nicht sichergestellt, dafi jeder 
Konfigurations-Befehl (KW) auch ausgefiihrt werden kann..- 
Dies kann.zum Beispiel daran scheitern, daft das 
adressierte konf igurierbare Element (CEL) seine Aufgabe 
noch nicht beendet hat und somit keine neuen 
Konfigurationsdaten entgegen nehmen kann. Urn einen 
Performance Einbruch zu verhindern, werden alle 
Konfigurationsbefehle, welche nicht abgearbeitet werden 
konnten (da sich die entsprechenden CELs in einem nicht 
umkonf igurierbaren Zustand befanden und die 
Konf iguration ablehnten (REJECT) ) , entsprechend eines 
FIFOs hinter den letzten sich in einem (nachfolgend 
naher beschrieben) speziellen Speicher (FILMO) 
befindenden Konf igurationsbefehl geschrieben. Danach 
wird der nachsten Konf igurationsbefehl^ nach dem 
gleichen Verfahren, abgearbeitet. Dies wiederholt sich 
solange/. bis das End,e einer Konf iguration erreicht 
wurde. 

Danach geht die CT, wieder in den Zustand iiber, in dem 
sie Trigger-Signale akzeptiert, urn eventuell weiter 
Konfigurationen zu laden. In diesem Zustand arbeitet die 
CT den FILMO. in regelmaBigen Abstanden, durch einen 
Zeitgeber gesteuert, ab. 
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Eine Priorisierung der zu ladenden Konf igurationen wird 
erreicht, .indem die CT den Speicher FILMO durchlauft, 
bevor die eigentlich zu ladende Konf iguration bearbeitet 
wird . Durch. eihe FIFO-Shnl iche. Struktur des FILMO wird 
sichergestellt, . dafi KWs, : welche w^hrend vorhergehenden. . . 
Triggeranforderungen nicht vollstandig abgearbeitet 
werden konnten, automatisch eine hohere Pripritat vor 
den neu abzuarbeitenden WK erhalten. Bei der Abarbeitung 
des Speichers. (FILMO) wird jedes durch einen 
Kdnfigurationsbefehl adressierte konf igurierbare Element 
(CEL) vor Oder wahrende des Sendens eines KWs getestet, 
Ob es sich im Zustand "umkonf igurierbar " befindet. 1st 
dieser Zustand "umkonf igurierbar" (ACCEPT) , werden die • 
baten iibertragen und aus dem Speicher FILMO geloscht. 
1st der Zustand "nicht umkonf igurierbar" (REJECT) , 
bleiben die Daten im FILMO und werden beim nSchsten 
Durchlauf erneut abgerarbeitet. Die CT verarbeitet den 
nachsten Eintrag im FILMO. 

Dies wiederholt sich solange, bis das Ende des FILMO 
erreicht ist. Danach wird die eigentliche, durch das 
Auftreten des Trigger-Signals aktivierte Konf iguration 
abgearbeitet. Der Aufbau des FILMOs entspricht dabei dem 
FIFO Prinzip, das heifit, es werden die Mltesten Eintrage 
zuerst verarbeitet. Urn den FILMO auch abzuarbeiten, wenn 
keine neue KR geladen wird, wird der FILMO von einem 
Timer gesteuert in regelmaBigen AbstSnden durchlauf en. 

Die ubrigen, nicht beteiligten konf igurierbaren Elemente 
(CEL) arbeitet wahrend dieser Phase parallel welter und 
wird nicht in ihrer Funktion beeinflulit. Dadurch kann 
der Fall eintreten, dafi wahrend die CT den FILMO 
abarbeitet, eine oder mehrere konf igurierbaren Elemente 
(CELs) in den Zustand "umkonf igurierbar" ubergehen. Da 
die CT sich mit der Abarbeitung an einer beliebigen 
Stelle innerhalb des FILMOs befinden kann, konnte 
folgender Fall eintreten: 
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Die CT versucht einen.ersten Befehl abzuarbeiten dessen 
adressiertes konfigurierende Element (CEL) . sich nicht .in 
dem Zustand "umkonf igurierbar" befindet. Die CT fahrt 
sorriit mit dem nachs'ten Befehl (KW) fort . Zur' selben Zeit 
gehen ein oder mehrere konf igurierbaren Elemente in den . 
Zustand "umkonf igurierbar" uber, darunter auch das 
konf igurierbare Element, welches durch den ersten 
Konf igurationsbefehl hatte beschrieben werden konnen. 
Die CT verarbeitet einen zweiten Konf igurationsbefehl 
(KW), welcher das gleiche kqnf igurierbare. Element (CEL.).. 
benutzt, wie der erste Konf igurationsbefehl, allerdings 
aus einer anderen Konf iguration stammt. Zu diesem 
Zeitpunkt,. befindet sich das konf igurierbare. Element - 
(CEL) in dem Zustand "umkonf igurierbar " und der Befehl 
kann erfolgreich abgerarbeitet werden. 

Dadurch ist nicht mehr sichergestellt, daJi die 
Konfiguration^ welche zuerst geladen werden sollte, auch 
tatsachlich zuerst fertiggestellt wird. Es konnen nun 
zwei teilweise fertige Konf igurationen existieren, 
welche jeweils konf igurierbare Elemente der anderen 
Konfiguration benotigen, um vollstandig geladen zu 
werden. Eine Deadlock-Situation ist eingetreten, die in 
Figur 18 verdeutlicht wird. Konfiguration A und 
Konfiguration B sollen konfiguriert werden. Die CT hat 
den schraffierten Teil von Konfiguration A und 
Konfiguration B bereits geladen. Konfiguration A 
benotigt zur Fertigstellung noch den hell-doppelt 
schraffierten Bereich von Konfiguration B, und 
Konfiguration B benotigt zur Fertigstellung noch den 
dunkel-doppelt schraffierten Bereich von Konfiguration 
A. Da beide Konf igurationen noch nicht vollstSndig 
abgeschlossen sind, und somit auch nicht funktionsfahig, 
tritt fiir keine der beiden Konf igurationen der 
Terminierungszustand ein, in dem eine der 
beiden Konf igurationen entfernt wiarde. Beide 
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Konfigurationen warten darauf, dafi die noch benotigten 
kohfigurierbaren Elemente freigegeben werden. 

In deiini. yof iiegenden Verfa^ 

verhindert/ indem die CT vor der Ab.arbeitung des FILMOs 
die Zustande alier konf igurierbarer Elemente erfafit und 
danach bis zur Beendigung des Vorgangs keine Anderungen 
mehr zulaBt, bzw. auftretende Anderungen ignoriert. Mit 
anderen Worten, es werden entweder die Zustande aller 
konfigurierbaren Elemente vor der Abarbeitung des FILMOs 
gesichert oder eine Veranderung der Zustande wahrend der 
Abarbeitung des FILMOs verhindert . Eine mogliche 
technische Ausfiihrung ist der Einsatz eines Registers in 
jedem konfigurierbaren Element, in das der Zustand vor 
Abarbeitung des FILMOs gesichert wird. Die CT arbeitet 
nur auf Basis der erfaaten Zustanden und nicht mit den 
aktuellen Zustanden der konfigurierbaren Elemente. 
Dadurch ist sichergestellt, daJi jeder zu bearbeitende 
Befehl (KW) den gleichen Zustand der konfigurierbaren 
Elemente (CELs) vorf indet . Dieser Schritt schliefit nicht 
aus, dali ein oder mehrere konfigurierbaren Elemente 
wShrend der Abarbeitung des FILMOs, in den Zustand 
"umkonfigurierbar" ubergehen. Diese Anderung ist fur die 
CT wahrend der Verarbeitung lediglich nicht sofort 
sichtbar, sondern erst zu Beginn des nachsten 
Durchlaufs. 

Konfigurations-Reihenfolgen 

Zur Konfiguration bestimmter Algorithmen ist es 
unbedingt notwendig, die Reihenfolge in der die KW in 
die CEL geschrieben werden exakt einzuhalten. 
Beispielsweise ist es sinnvoll vor AnschluB einer CEL an 
ein Bussystem, zuerst das Bussystem zu konf igurieren, 
damit die CEL nicht an einen von einer anderen Routine 
benutzten Bus angeschlossen wird. Mit anderen Worten, 
eine CEL wird nur konf iguriert, wenn vorher die 
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entsprechenden Busverbindungen konfiguriert werden 
konnten . 

in dem erf indungsgemafien Verfahren wird die Einhaltung 
eihes fes'ten Ablaufes wie f olgt erreicht : 
Konfigurationsworte (KWs)., deren Ausfiihrung entscheidend 
fur die Konf iguration der nachf olgenden KWs sind, werden 
besonders gekennzeichnet (und im f olgenden KWR genannt) . 
Schlagt die Konf iguration eines solchen KWR fehl, werden 
alle nachfolgenden KWs innerhalb der betreffenden 
Konf igurationsroutine. (KR) auf .den FILMO geschrieben und . 
in diesem Durchlauf nicht ausgefiihrt . Auch beim 
Durchlaufen des FILMOs werden samtliche KWs, die sich in 
der Reihenfolge hinter einera KWR befinden, dessen 
Konf iguration fehlschlug, in dem aktuelleh Durchlauf 
nicht ausgefiihrt. 

Cache-Verfahren 

Die CT-Struktur ist hierarchisch aufgebaut, d.h. es 
existieren in einem Baustein mehrere CT-Ebenen. Die 
Anordniing entspricht vorzugsweise einer Baumstruktur 
(CT-Tree) . Dabei ist der Wurzel-CT (Root~Ct) ein 
externer Konf igurationsspeicher (ECR) , der samtliche KRs 
enthalt zugeordnet, wahrend den Blattern die 
konfigurierbaren Elemente (CELs) zugeordnet sind, die 
einzelne KRs aufrufen. Den CTs der mittleren Ebenen sind 
jeweils die konfigurierbaren Elemente zugeordnet^ die 
sich auf derselben Hierarchiestufe befinden. . 
Jeder CT ist ein lokaler interner Speicher zugeordnet. 
Dieser Speicher wird partiell geloscht, wenn neu zu 
speichernde KRs keinen Platz mehr haben, oder dies 
explizit durch einen speziellen CT-Befehl (REMOVE) 
angefordert wird. Dabei erf olgt das Loschen KR-weise, 
anhand einer L5schstrategie, so dafi bestenfalls nur die 
KR geloscht werden, die nicht mehr angefordert werden 
Oder explizit beim REMOVE-Bef ehl angegeben sind. 
Ebenfalls werden die KR einzeln geloscht, nur genau so 
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viele, daB genau so viel Speicher frei ist, wie 
notwendig ist um die neu zu ladende KR in den Speicher 
zu schreiben. Dadurch wird erreicht, dafi moglichst viele 
KR zur Optimierurig des Cache-Effektes in dem Speicher 
verbleiben. . 

Der Vorteil liegt darin, daB jede, einer beliebigen CTx 
untergordente CT, die sich also weiter oberhalb im CT- 
Baum befindet eine KR, die in der CTx gespeichert ist, 
nicht von dem externen Konf igurationsspeicher ECR 
anf ordert, spndern dire.kt von CTx ..erhalt . Dadurch. ergibt 
sich eine Cachestruktur uber mehrere Ebenen. Der 
Datenubertragungsaufwand im CT-Baum und insbesondere die 
benotigte. Speich^rbandbreite . des ECR. wird erheblich. 
gesenkt. 

Mit anderen Worten speichert jede CT die KRs der unter 
ihr liegenden CT zwischen. D.h. die tieferliegenden CTs 
erhalten die benotigten KRs direkt von den 
daruber liegenden, ein Speicher zugr if f auf das externe 
ECR ist nicht notwendig. Nur wenn eine benotigte KR 
nicht in einer der hoherliegenden CTs bereits vorhanden 
ist, muii die KR iiber einen Zugriff auf das ECR geladen 
werden. Dadurch ergibt sich einer besonders effiziente 
hierarchische Cache-Struktur fiar KRs. 
Auf Basis dieser Struktur ergeben sich auch mpgliche 
Loschstrategien, die allerdings je nach Anwendung 
empirisch festgelegt werden sollten. Einige 
Moglichkeiten sind: 

- Loschen des altesten Eintrage 

- Loschen der kleinsten Eintrage 

- Loschen der groBten EintrSge 

- Loschen der am seltensten abgerufenen Eintrage 
Grundlage von CT-Hierarchien 

Um einen Cache-Effekt zu erzielen, werden CTs zu einer 
Hierarchie in Baumstruktur zusammengeschaltet . Zwischen 
den einzelnen Knoten (CTs) befindet sich ein Bussystem 
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(Inter-CT-Bus) , daJi jeweils einen oberen Knoten (CTs) 
mit mehreren unteren Knoten (CTs) verbindet. Dabei 
fbrdern untere knoten (CTs) Daten von den oberen Knoten 
.(CTs) anV .die oberen Kri senderi die. Daten daraufhin 
an die unteren Knoten. Die unteren Knoten tauschen . 
untereinander Statusinformationen aus, dazu werden die 
Netzwerke zwischen den hoheren Knoten verwendet, die 
entsprechend die Adressen auflosen miissen. 

CT-Hierar:chie und Adressierung 

CT-Hierarchien sind so angeordnet^ dafi zur Adressierung 
der einzelnen CTs ein Binarbaum verwendet werden kahn. 
Das bedeutet, dafi das niederwertigste Adressbit die 
einzelnen Blatter des Baumes kennzeichnet und jedes 
weitere Adressbit jeweils eine Hierarchieebene hoher 
selektiert, Jede CT besitzt damit eine eindeutige 
Adresse . 

Die nachfolgende Tabelle zeigt, wie die einzelnen 
Adressbits den jeweiligen Ebenen zugeordnet sind: 
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Soli einer Gruppe von CTs eine iibergeordnete CT 
zugeordnet werden, werden mehrere Adressbits der Gruppe 
entsprechend zusammengef afit . 
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Die nachfolgende Tabelle zeigt, wie die einzelnen 
Adressbits den jeweiligen E)t>enen zugeordnet sind,..d^bei 
befindet sich auf Ebene 6 eine Gruppe mit 8 CTs 

■•^(Adresbit 2, .0) :* ■ / • ■ \ ; ■ ; 
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Der Aufbau des Binarbauraes kann eindimensional oder 
mehrdimensional erfolgen, indem pro Dimension ein 
Binarbaum aufgebaut wird. 

Eine bestirnrate CT (TARGET) wird adressiert, indem die 
initierende CT (INITIATOR) entweder die exakte . . 
Zieladresse angibt, oder TARGET relativ adressiert. 

Die Auswertung einer relativen Adresse wird im folgenden 
nahers beschrieben: 



Beispiel eines relativen Adressfeldes fiir eine 
zweidimensionale Adressierung: 
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BitlS ist gesetzt, wenn die CT der nachsthoheren 
Hierarchiestufe selektiert werden soli; 
Bitl4 kennzeichnet Broadcasts, selektiert also alle CTs. 
Die X/Y-Adfessen geben die' Adf^sse von TARdET ausgeherid 
yon der Adresse v.qn INITIATOR an. 

Die Adressen sind vorzeichenbehaftete "signed" Integer- 
Zahlen. Durch Addition der Y/X-Addressen des 
Adressfeldes. zu der aktuellen Adressposition, wird 
TARGET bestiinmt. Jede Ebene besitzt eine bestimmte 
Adressbreite (Addresswidth) . Die Addierer entsprechen 
dieser Breite. 

Ein Uber- oder Unterlauf bei der Addition bedeutet, . dafi 
die adressierte CT nicht unterhalb des aktuellen Knotens 
liegt und die Adressanf orderung wird an die 
daruberliegende CT (den nachsthoheren Knoten) 
weitergegeben . 

Tritt kein tiber- oder Unterlauf auf, befindet sich 
TARGET unterhalb des aktuellen Knotens. Das auf der 
aktuellen Ebene berechnete Adressbit (vgl. Tabellen) 
selektiert den direkt unter dera aktuellen Knoten 
liegende CT. Von dieser aus wird jeweils anhand des 
entsprechend berechneten Adressbits die nachst tiefere 
CT (Knoten) selektiert. 

Pribrisierung von Zugriffen in CT-Hierarchien 

Die Zugriffe auf den Inter~CT-Bus werden von einem 
Arbiter verwaltet. Dabei sind alle unteren Knoten gleich 
priorisiert. Der obere Knoten besitzt eine hohere 
Prioritat. Dadurch sind Zugriffe, die von einem hoheren 
Knoten nach unten iibertragen werden, oder bereits einen 
weiten Weg vom INITIATOR aus zuruckgelegt haben anderen 
Zugriffen uberlegen. 

Der Grundaufbau einer CT 

Die nachfolgende Ubersicht uber die CT gibt einen 
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Uberblick iiber die einzelnen Baugruppen. Die detailierte 
Beschreibung der Baugruppen wird im folgenden gegebeni 

Kern einer CT ist dieSteuer-StatemaChine (CTS) die 
samtliche Abarbeitungen yon Konfigurationsroutinen (KRs) 
steudrt. Der CTS zugeordnet ist, der Garbage-Kollektor 
(GO , der das Entf ernen von KR aus dem Speicher (CTR) 
der CT steuert; das FILMO, das die Verwaltung der noch 
abzuarbeitenden KWs uberninunt und die LOAD-Statemachine, 
die das Laden von KRs steuert. 

Der Speicher (CTR) ist als gewohnlicher Schreib-Lese- 
Speicher ausgestaltet, wobei alle technisch, moglichen 
Implementierungen zum Einsatz kommen korinen, und wird 
2ur lokalen Speicherung von KRs fiir die jeweilige CT und 
deren untergeordnete CTs verwendet. Als Sonderfall kann 
der Speicher (CTR) auch als ROM, EPROM, EEPROM, Flash- 
ROM o.a. ausgestaltet sein, um den Baustein mit einer 
festen, ASIC Oder PLD-ahnlichen (siehe Stand der 
Technik) Funktion zu versehen. 

Zur Generierung der CTR-Adressen werden vier als ladbare 
Zahler ausgestaltete Pointer verwendet: 

1. Free-Pointer (FP) . Zeigt auf den ersten freien 

Speicherplatz hinter der letzte KR im CTR. 

2. Garbage-Pointer (GP) . Zeigt auf einen durch den 

Garbage-Kollektor . (GC) zu entf.ernenden . Eintrag aus dem 
CTR." ' • 

3. Move-Pointer (MP). Zeigt auf eine Speicherstelle im 
CTR, von der ein giiltiges, nicht zu entfernendes 
Konfigurationswort (KW) , also einen Eintrag eines KR, an 
den durch GP definierten Eintrag kopiert/bewegt wird. 

4. Program-Pointer (pp) . Zeigt auf das momentan von der 
CTS ausgefiihrten KW. 
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KW werden tiber ein Ausgabe-Interface (OUT) an die 
2ugeh5renden CELs weitergegeben. Die CELs guittieren 
(ACCEPT) f sof em sie sich in einem umkonf igurierbaren 
Zustarid befihderi den Enpfahg'd^ KW. Wird ein KW'nicht 
quittiert (REJECT), wird es in einem FIFO-ahnlichen: = 
Speicher (FILMO) , zeitweise zwischengespeichert, um zu 
einem spateren Zeitpunkt, ohne den Program-Pointer zu 
benutzen, erneut an die adressierte CEL geschrieben zu 
werden . 

Eine Aufforderung zur Abarbeitung eines KR erhalt die 
CTS durch Triggersignale . Die ■ Triggersignale durchlaufen 
eine Maske, das ist ein Filter, der unerwunschte Trigger 
ausfiltert (ausmaskiert) ; Eine Maske kann nach dem Stand 
der Technik durch UND-Gatter (AND) aufgebaut werden, die 
einen Trigger mit einem Freigabe-Signal UND-verkniipf t . 
Die Trigger werden iiber einen priorisierten Round-Robin- 
Arbiter (SCRR-ARB) in Binarsignale umgewandelt. Ein 
priorisierter Round-Robin-Arbiter verknupft den Vorteil 
der Gleichberechtigung eines Round-Robin-Arbiters mit 
der Erkennung der nachsten Freigabe in einem Takt, also 
dem Vorteil eines Prioritats-Arbiter . 

Die maskierten Trigger werden als Adresse auf eine erste 
Lookup-Tabelle (LUTl) gfeschaltet, das ist qin Speicher, 
der dem als Adresse eingehenden Trigger das ID der 
betreffenden KR zuordnet und auf den Datenleitungen 
ausgibt. 

In einer zweiten Lookup-Tabelle (LUT2) wird die ID der 
KR der Adresse des Speicherplatzes der KR im CTR 
zugeordnet. Die zweite Lookup-Tabelle wird nicht nur zur 
Zuordnung von Trigger-Signalen verwendet, vielraehr 
benutzen Befehle, die eine ID als Parameter verwenden, 
die LUT2 ebenfalls zur Adress zuordnung. 
Die Zuordnung der Trigger-Signale zu den betreffenden 
IDs wird uber den nachfolgend beschriebenen Befehl 
"REFERENCE" in die LUTl eingetragen. Die Verwaltung der 
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LUT2, also die Zuordnung der IDs zu den Adressen im CTR, 
geschieht automatisch durch die CIS und den GC. 

Zum bessereh VeristSndnis der GT ist im fblgenden- eih . 
moglicher Grundbefehlssatz dargestellt.:. 

1. BEGIN <ID> 

Durch BEGIN <ID> wird der Anf ang einer 
Konfigurationsroutine gekennzeichnet . <ID> gibt die 
eindeutige Identif ikationsnuramer der 
konfigurationsroutine an. 

2. STOP ' 

Durch STOP, wird das Ende einer Konfigurationsroutine 
gekennzeichnet . An dieser Stelle beendet . die . 
Konfigurationstabelle (CT) die Abarbeitung der 
Konfigurationsroutine. Der Garbage-Kollektor (GC) 
beendet das Entfernen von Eintragen dieser 
Konfigurationsroutine . 

3. EXECUTE <ID> 

Springt zum Beginn (BEGIN <ID>) einer 
Konfigurationsroutine. Ist diese Routine nicht im 
Speicher der CT vorhanden, so wird sie von der 
daruberliegenden CT angefordert, bzw. aus dem Speicher 
geladen . 

4. LOAD <ID> 

Fordert die KR <:ID> von der daruberliegenden CT an. 

5 . REMOVE <ID> . 

Ruft den GC auf, xain die Konfigurationsroutine <ID> von 
BEGIN <ID> bis STOP aus dem Speicher der CT zu entfernen 
und die nachfolgenden Konf igurationsroutinen so weit 
vorzuschieben. daU kein Speicherloch durch die entfernte 
Konfigurationsroutine entsteht. 

6. PUSH <FORCED> <ADDRESS> <DATA> <EXIT> 

Schreibt die Konf igurationsdaten <DATA> an das Register 
<ADDRESS>. 1st <FORCED> gesetzt, werden die Daten auch 
geschrieben, wenn das RECONFIG-Flag des betreffenden 
Zielregisters nicht gesetzt ist. <EXIT> wird verwendet 
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und anzuzeigen, dali es sich urn ein KWR handelt, das bei 
einem REJECT die weitere Ausfuhrung der nachfolgenden 
kwRs aibbricht , 
,7- MASK <:jSR> ;<:TftlGGER> 

Setzt die Trigger-Maske mit <TRIGGER>, bzw, . setzt sie 
mit <TRIGGER> zuriick^ abhangig von <SR> (Set/Reset) . 

8. WAIT <UNMASKED> <TRIGGER> 

Halt die Abarbeitung der Konf igurationsroutine an und 
wartet auf den Trigger <TRIGGER>. 1st <UNMASKED> 
gesetzt/ wird auf das. erwartete Trigger unabhangig des 
Zustandes der Trigger-Maske reagiert. 

9. TRIGGER <TRIGGER><CT#> 

Sendet den Binarwert eines . Triggers, an . die iibergeordnete 
durch CT# adressierte CT. 

10. GETBUS/GETCTS 

Baut eine Verbindung zu dem Inter-CT-Bus auf. 

11. LOOSEBUS/LOOSECTS 

L6st die Verbindung zum Inter-CT-Bus auf. 

12. REFERENCE <TRIGGER><ID> 

Schreibt in die LUTl bei Adresse <TRIGGER> den Wert 
<ID>, wodurch einem Triggersignal eine bestiirante KR 
zugeordnet wird. 

Die Befehle EXECUTE, LOAD, REMOVE, PUSH, MASK, WAIT, 
TRIGGER, REFERENCE sind nur innerhalb der Klanimer BEGIN 
... STOP giiltig. Aufierhalb dieser Klammer werden die 
•Befehle .nicht .ausgefuhrt. 



Der Aufbau einer Konf igurationsroutine (KR) sieht wie 
folgt aus: 
BEGIN <ID>; 
... 

gultige Befehle 

• • • 

STOP; 
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ihdirekt^ Addressieziing (Ref erenzieri^ng) , 

Das Cache-Prinzip der CT ermoglicht das 
Zwischenspeichern eirier KR in eiher 6t, wbbei' die KR von 
. mehreren unterschiedlichen tieferliegenden CTs Oder. CELs 
genutzt werden, 

Werden von den tieferliegenden Einheiten Zugriffe auf 
das externe Interface des Bausteines (z.B, RAM, 
Peripherie) durchgefuhrt, ergibt sich die Notwendigkeit 
unterschiedliche Adressen oder Teile des externen 
Interfaces zu speichern. Dadurch vrtirde sich der Inhalt 
der einzelnen benotigten KRs grundlegend unterscheiden. 
Ein Caching ist nicht mehr moglich. 
Abhilfe schafft eine indirekte Referenzierung'. Dazu 
werden spezielle KR (im folgenden IKR genannt) 
verwendet, die die notwendigen externen Parameter 
beinhalten und setzen. Eventuell werden uber Trigger 
andere unterschiedliche KRs in verschiedenen 
Hierarchieebenen aufgerufen. Ab Ende einer IKR wird das 
eigentliche KR aufrufen. Lediglich die IKR sind nicht 
cachebar, wahrend die aufgerufenen KR durchaus 
einheitlich und daher cachebar sind. Es ist sinnvoll, 
die Grofie der IKR auf das absolute Minimum zu 
reduzieren, namlich ausschlieiilich die externen. und 
unterschiedlichen Parameter und den Auf ruf der 
einheit lichen KR. 

Eine indirekte Konfigurationsroutine (IKR) ist wie folgt 
auf gebaut : 
BEGIN <ID>; 
• • • 

xxx; giiltige Befehle, wobei lediglich externe Peripherie 

angesteuert werden sollte, 
TRIGGER <ID>; Start-, Stop- oder Lade-Anf orderungen ah 

Periphere Prozesse 

GOTO <ID>; Sprung zur einheit lichen KR 
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STOP; 



; . V Sonderfalle: • ' • .; 

1 . WAIT_FOR_BOOT 

Dieses Koirimando ist nur an der ersten Adresse des CTR ' 
gUltig. Wahrend des Boot-Vorganges wird zuachst die 
komplette Boot-KR in das CTR geschrieben, jedoch nicht 
die Beginnsequenz des Boot-KR BEGIN <0>. An dessen 
Stelle (auf Adresse 1) steht WAIT-FOR-BOOT/ das bei 
einem RESET automatisch gesetzt wird. Erst nachdem die 
gesamte Boot-KR in das CTR geschrieben ist, wird 
WAIT_FOR_BOOT mit BEGIN <0> iiberschrieben und ..die CTS . 
beginnt mit der Abarbeitung der Boot-KR. 
WAIT_FOR_BOOT darf nicht innerhalb eines Progranimes 
auftreten. 

2. BOOT <CT-ID> 

BOOT <CT-ID> kennzeichnet in welche CT die nachfolgende 
Boot-KR geschrieben werden soil. Nach BOOT <CT-ID> folgt 
kein BEGIN, die Boot-KR wird nciht durch STOP, sondern 
durch ein nachfolgendes BOOT <CT-ID> abgeschlossen. Ein 
STOP beendet den Bootvdrgang, 

BOOT <CT-ID> darf nicht innerhalb eines Progranimes 
auftreten- 

Boot-Vorgang 

Nach einem RESET ladt die CT des obersten Hierarchie- . 
Levels (ROOT-CT) die Boot-KR in die CTs der unteren 
Hierarchien. Dazu existiert ein Sprung an eine 
festgelegte Adresse (BOOT-ADR) im, der ROOT-CT 
zugeordneten, externen Konf igurationsspeicher (ECR) . Die 
ROOT-CT fiihrt diesen Sprung durch und erreicht die Boot- 
Sequenz. Diese ist wie folgt aufgebaut: 
BOOT <CT-IDO>; COMMAND; COMMAND; ... 
BOOT <CT-ID1>; COMMAND; COMMAND; . . . 
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BOOT <CT--IDn>; COMMAND; COMMAND; ... 
STOP; 

wahrend des Bo6t--Vorganges wird zunSchst die komplette 
Bbot-KR in das CTR ab Adresse 2 der durch <CT-lb> . 
angegebenen CT geschrieben. Die; Beginnsequenz des Boot- 
KR (BEGIN <0>) wird nicht auf Adresse 1 geschrieben. An 
dessen Stelle steht WAIT-FOR-BOOT, das bei einem RESET 
automatisch gesetzt wird. Erst nachdem die gesamte Boot- 
KR in das CTR. geschrieben ist, und die ROOT-CT das 
nachste BOOT <CT-lb> erreicht hat, wird. STOP an das Ende 
des Boot~KR in das CTR geschrieben und WAIT_FOR_BOOT mit 
BEGIN <0>uberschrieben. Die ^CTS beginnt mit der 
Abarbeitung der Bopt-KR. 

Laden einer Konf igurationsroutine 

Es existierem drei Gundmechanismen urn eine 

Konf igurationsroutine, auBer der Boot-KR anzufordern: 

1. Ausfuhren eines LOAD <ID> durch die CTS 

2. Ausfiihren eines EXECUTE <ID> durch die CTS, wobei die 
KR mit der betreffenden ID nicht im CTR vorhanden ist. 

3. Auftreten eines Triggers, der iiber die LUTl auf einen 
<ID> ubersetzt wird, dessen zugehorige KR nicht im CTR 
vorhanden ist . 

Der Ablauf in alien drei Fallen ist derselbe: 

Die ID der -angeforderten KR wird der .LUT2 als Adresse 

angegeben. Die LUT2 uberpriifb, pb eihe giiltige Adresse 

im CTR exist iert. Existiert diese nicht, d.h. <ID> zeigt 

in der LUT2 auf den Wert 0, wird load <ID> an die GTS 

gesendet. 

Die CTS fordert daraufhin die <ID> betreffende KR bei 
der hierarchisch iibergeordneten CT an. Diese Anforderung 
erreicht. die iibergeordnete CT in Form eines Triggers und 
wird entsprechend von ihr ausgewertet. 
Die iibergeordnete CT sendet die angeforderte KR an die 
anfordernde CT. Die Daten werden ab der Adresse, auf die 
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der FREE-POINTER (FP) zeigt in das CTR geschrieben, 
wobei der FP nach jedem Schreibzugrif f um eins erhoht 
wird, 

Erreieht der FP 'die pbere Grerize des- CTR/ Wird der ' ■ 
Garbage-Kollektor (GO aufgerufen, um die unterste'KR ... 
innerhalb des CTR zu entfernen und das CTR zu 
komprimieren . Der FP wird dabei neu gesetzt. Dieser 
Vorgang findet so lange statt, bis die zu ladende KR 
komplett in das CTR pafit. 

Sprungtabelle im Konfigurationsspeicher 

Der der ROOT-^CT zugeordiiete Konfigurationsspeicher 
- . beinhaltet samtliche. KR,. die ftir eine Applikation 
geladen werden mussen. Im externen 

Konfigurationsspeichers (ECR) befindet sich an einer 
festgelegten Adresse (ADR-BOOT) Sprung zu der Boot- 
Konfigurat ions-Routine. In einem weiteren festgelegten 
Speicherbereich (LUT-ECR) beliebiger, jedoch innerhalb 
einer Applikation fest vorgegebener Lange die Sprunge zu 
den einzelnen KRs . Dabei wird die <ID> der jeweiligen KR 
als Adresse im ECR verwendet, an der die Startadresse 
der jeweiligen KR steht; wodurch KRs indirekt adressiert 
werden: 

ID -> LUT-ECR -> KR 

Anderung der KR im Konfigurationsspeicher 

Die KR mit der ID <A> soil geandert werden. Zunachst 
schreibt der HOST die neue KR fiir die ID <A> an eine 
freie Speicherstelle im ECR. Die ID <A> wird zusammen 
mit der neuen Adresse der KR im Konfigurationsspeicher 
von der iibergeordneten Einheit (HOST) in ein dafur 
vorgesehenes Register der ROOT~CT geschrieben. Die ROOT- 
CT sendet an alle darunterliegenden CTs das Kommando 
REMOVE <A>. Daraufhin entfernen alle CTs beim Erreichen 
eines STOP Oder wShrend IDLE-Zyklen, also sobald keine 
KR ausgefiihrt wird, die auf diese ID bezogene KR aus dem 
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CTR und setzen die LUT2 an Adresse <A> auf "NoAdr", das 
. bedeutet, iss existiert keine giiltiger .Adresseintrag. fur . 
ID <A> in LUT2. Wird die ID <A> erneut angefordert, 
.zwingt der fehlehde Eintrag ("NoAdr") an Stelle <A> in 
die LUT2 jede CT.die KR <A> vom ECR neu anzufordern. 

Das FILMO 

Ein KR besteht hauptsachlich aus dem Befehl PUSH, der 
neue Konf igurationsworte an . eine. bestimmte Adresse 
schreibt, 1st das Schreiben eines Konf igurationswortes 
des Types KW nicht moglich, da das adressierte 
korifigurierbare Element (CEL) nicht ber^it ist eiiie neue 
Konfiguiration zu empfangen (REJECT) , wird das . 
Konf igurationswort statt an das adressierte 
konfigurierbare Element (CEL) in einen Speicher, im 
folgenden FILMO genannt, geschrieben. Die nachf olgenden 
Befehle werden normal abgearbeitet, bis erneut ein 
Konfigurationswort nicht geschrieben werden kann, das 
dann in das FILMO geschrieben wird. 

Ist das Schreiben eines Konf igurationswortes des Types 
KWR nicht moglich, da das adressierte konfigurierbare 
Element (CEL) nicht bereit ist eine neue Konf iguration 
. zu . empfangen (REJECT) , wird das, Konf igurationswort statt 
an das adressierte konfigurierbare Element (CEL) in 
einen Speicher, im folgenden FILMO genannt, geschrieben. 
Alia nachf olgenden Befehl^ bis zum Ehde der KR werden 
nicht an die CEL, sondern direkt in das FILMO 
geschrieben* 

Das FILMO wird in IDLE-Zyklen und vor jedem Ausfiihren 
eines neuen KR komplett durchlaufen. Dabei wird, 
beginnend beim altesten Datenwort, entsprechend eines 
FIFOs nach dem Stand der Technik, jedes ausgelesene Wort 
des FILMOs an sein adressiertes Element zu senden; dabei 
muB das adressierte Element bereit sein das 



25 



wo 99/44147 



PCT/DE99/00504 



Konfigurationswort zu empfangen. Sofern die Datenworter 
von Beginn an geschrieben. werden konnen (d.h. die . 
adressierten konf igurierbaren Elemente (CELs) sind 
bereit). wird der feintrag aus dem FILMO hach Art eines 
FIFOs entfernt. Kann. ein Konfigurationswort nicht 
geschrieben werden, wird es iibersprungen und nicht aus 
dem FILMO entfernt. Im Gegensatz zu einem FIFO werden 
die Daten nach dem ubersprungenen Konfigurationswort 
weiter ausgelesen. Konf igurationsworte, die nach einem 
Ubersprungenen Konfigurationswort geschrieben werden - 
konnen werden entweder je nach Implement ierung des 
FILMOs 

1. als geschrieben markiert und nicht aus dem FILMO 
geloscht, wobei als geschrieben markierte 
Konfigurationsworter bei den folgenden Durchlaufen nicht 
mehr gelesen werden, bzw. sofort gelSscht werden, sofern 
kein ubersprungenes Konfigurationswort mehr vor ihnen 
liegt; 

Oder 

2. aus dem FILMO geloscht, wobei die 
Konfigurationsworter vor und nach dem geloschten 
Konfigurationswort erhalten bleiben, dabei mussen zum 
Loschen die nachfolgenden Worte nach vorne (oben) oder 
die davorliegenden Worte nach hinten (unten) geschpben . 
werden, wobei die Reihenfolge der Konf igurationsworte 
unbedingt beibehalten wird, 

Wird eine neue KR ausgefiihrt, werden die 
Konf igurationsworte (KW) , die von der CTS nicht an die 
adressierten Elemente (CELs) geschrieben werden konnten, 
erneut an das FILMO angehangt, d.h. die KW werden an das 
Ende (aus Leserichtung) des FILMOs geschrieben. 1st das 
FILMO voll, d.h. es exist ieren keine freien EintrSge fur 
Konf igurationsworte, wird die Ausfiihrung des KR 
gestoppt. Das FILMO wird so lange durchlaufen, bis 
genugend Konf igurationsworte geschrieben werden konnten 
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und entsprechend viele freie Eintrage entstanden sihd, 

woraufhin das KR welter" abgearbeitef wird. 
Das FILMO stelit eineh FiFO-ahniichen Speic^^ dar, der 
immer ypm aitesten Eintrag an linear durchlaiifen wlrd, . 
im Gegensatz zu elnem FIFO werden jedoch Eintrage 
iiber^prungen (First' In Linear Multiple Out) . 

Die Funktion der Konfigurationstabellen- 
Statexnachine (CTS) 

Die Konfiguratlonstabellen-Statemachine (CTS) ubernimmt 
die Steuerung der CT. Dabei fuhrt sie die Befehle der KR 
aus und reagiert auf eingehende Trigger. Sie ubernimmt 
die Verwaltung des FILMOs, l.b. liest sie. in IDLE-Zyklen 
und vor dem Ausfiihren elner KR das FILMO aus. 
Sie reagiert auf die von der LUT-Struktur generlerten 
Signalen illegal <TRG> (Illegal Trigger, siehe Fig. 1, 
0102) und load <ID>. load <ID> wird generiert, wenn ein 
Cache-Miss in LUT2 vorliegt (0105), oder die durch ID 
referenzierte KR/IKR als gel5scht markiert wurde (0107) . 
Sie reagiert auf die Steuersignale der ubergeordneten 
CT. 

Ein Implementationsbeispiel fur die Verarbeitung der 
Befehle ist in den Figuren 2 bis 7 dargestellt. 

Steuersignale an iibergeordnete CTs 

- illegal <TRG> (0102) 

Zeigt der ubergeordneten CT an, dafi ein unbekaiinter 
Trigger <TRG> aufgetreten ist. 

- load <ID> (0105/0107) 

Fordert die ubergeordneten CT zum Laden der <ID> 

auf. 

- trigger <TRG> <CT#> (0108) 

Sendet einen Trigger <TRG> an die iabergeordnete 

Oder 

an die adressierte CT <CT#>. 
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Steuersignale von ubergeordneten CTs 
- remove <ID> (siehe Fig. 15, 1513) 

Fordert die CT zum loschen der <ID> auf . 
^: .write^^tolFP <^^^ (siehe Fig. 2> 0205) 

Sendet Daten an die CT. Die Daten werden an das 
Ende des belegten Speichers angehangt. 

Die Funktion des Garbage-Kollektors (GC) 

Der CTR unterliegt zwei Problemen: 

1. Verweist ein LOADt oder EXECUTE-Befehls,. bzw. ein . 
Trigger, auf eine ID, deren KR nicht im CTR vorhanden 
ist, mul5 die KR nachgeladen werden. U.U. ist jedoch 
nicht genugend Platz im CTR vorhanden um die 
angeforderte KR zu laden. 

2. Beim Auftreten eines REMOVE <ID> ist die 
entsprechende KR aus dem CTR zu entfernen. Dabei 
entsteht, sofern sich die KR nicht am Ende des CTR 
befindet eine Lucke. Beim Laden einer neuen KR wird die 
Liicke u.U. nicht wieder ganz aufgefiillt oder die Liicke 
ist zu klein fiir die neue KR. Dies fiihrt zu einer 
Fragment ierung des CTR. Die Aufgabe des Garbage- 
Kollektor ist es, KR aus dem CTR zu entfernen, um Platz 
fiir neue Eintrage zu schaffen UND nach Entfernen der 
Eintrage den CTR so umzuorganisieren, dafi alle 
verbleibenden KR als geschlossener Block hintereinander 
im Speicher liegen und die f reigewordenen - Speicherblocke 
als ein geschlossener Blpck an einem. Ende. des . CTR . 
liegen. 

Dadurch konnen auf optimale Weise und ohne Verluste an 
Speicherplatz neue KR nachgeladen werden. 

Auswerten von Triggerimpulsen 

Jede CT besitzt einen AnschluiS an mehrere zu ihrer 
jeweiligen Hierarchieebene gehorenden Triggersignale, 
die zu einem Bus zusammengef afit sind. Eingehende Trigger 
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werden uber eine Maske ausgewertet, d.h. nur die 
freigeschajteten Triggersignale werden weitergeleitet.. 
Die freigeschalteten Triggersignale werden taktsynchron 
in einem Sample-Register zwischehgespieichert 
. (gesampled) . Ein Arbiter wahlt.eines der gespeicherten 
Triggersignale aus und wandelt das Signal in einen 
binaren Vektor. Das gewahlte Triggersignal wird aus den 
Sample-Register geloscht, Der Binarvektor wird an eine 
erste Lookup-Tabelle (LUTl) weitergeleitet, die den 
, Binarvektor in die . Identif ikationsnummer (ID) der 
aufzurufenden Konf igurationsroutine (KR) iibersetzt. 
Die ID wird in einer zweiten Lookup-Tabelle (LUT2) in 
die Adresse der KR im CT-Speicher (CTR) iibersetzt. Die 
CT-Statemachihe (CTS) setzt ihren Prdgramm-Pointer (PP) 
auf diese Adresse und beginnt mit der Ausfuhrung der KR. 
Voraussetzung ist, daB jeder iiber die Maske 
freigeschaltete Trigger einen entsprechenden Eintrag in 
LUTl besitzt, Fehlt dieser, wird ein Fehlerzustand an 
die CTS weitergeleitet (illegal trigger) , dabei wird 
jede ID = "NoAdr" als nicht vorhandener Eintrag 
gewertet. "NoAdr" ist ein implementationsabhangig 
gewahltes Token. 

Fehlt der Eintrag in LUT2, d.h. die auf die ID bezogene 
KR befinidet sich nicht im CTR, wird eine Ladeanf orderung 
an die CTS gesendet (load <ID>) . 

Senden von Triggerinqpulsen an die libergeordnete 
CT 

Neben der bereits beschriebenen Schnittstelle zu einer 
libergeordneten CT zum Laden von KR existiert eine 
weitere Schnittstelle zum Austauschen von frei 
definierbaren Befehlen, insbesondere jedoch 
Triggervektoren. Dabei sendet eine CT 

- entweder an alle anderen CTs einen Befehl (BROADCAST) 
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- Oder an eine beliebige adressierte CT einen Befehl 
(ADDRESSED) 

Der Bef fehl " Triggerveict of " stelit einen" Binarwert dar , * 
der auf einen Eintrag in.der..LUT2 der empf angenden CT 
ref erenziert . 

Das Senden von Triggervektoren ist notwendig urn 
beispielsweise innerhalb einer IKR eine KR in einer 
weiteren CT zu starten urn beispielsweise die Peripherie 
Oder den Speichef anzusteuern, / . . • 

Zur Weiterleitung von Triggervektoren an eine 
iabergeordnete CT existieren 2 Mechanismen: ; 

1. Der LUTI wird ein Bit hinzugefugt, das angibt, ob der 
Inhalt des Speichers als KR ID Oder als Binarwert fiir 
einen Triggerimpuls betrachtet wird. Liegt ein 
Triggerimpuls vor, wird der Dateninhalt von LUTI direkt 
als Trigger an die iibergeordnete CT gesendet, 

2. Mit dem Befehl TRIGGER kann der Binarwert eines 
Triggers angegeben werden, der direkt an die 
iibergeordnete CT gesendet wird. (Alternativ konnten 
statt einem Triggerwert auch direkt IDs ubertragen 
werden) . 

Zum Starten einer KR in einer fremden CT iiber 
Triggervektoren muli zum Erreichen der Deadlockf reiheit 
ein -Synchronisationsverfahren geschaffen werden. Das 
Verfahren mufi beachten, daiS lediglich eine KR innerhalb 
eines bestiiranten Gruppe von CTs weitere KR auf anderen 
CTs innerhalb dieser Gruppe startet. Das Starten mehrere 
KR gleichzeitig kann zu einem Deadlock zwischen den CTs 
fiihren, ahnlich des bereits beschriebenen Deadlocks auf 
der CEL-Ebene. 

Das Grundprinzip eines solchen Verfahrens lauft wie 
folgt ab: 
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Ein KR ist wie folgt aufgebaut: 

• • • 

GETCTS/GETBUS 

• TRIGGER. <iD>, <ct#>-.- ; ■ 

... TRIGGER .<ip>, <CT#>.. ........ 

LOOSECTS/LOOSEBUS 

• • • • 

Der Befehl "GETCTS" innerhalb einer KR einer.CT 
(INITIATOR) zeigt an, dali im folgenden Signale an andere 
CTs (TARGET) gesendet werden. Mit Trigger <ID>, <CT#> ' 
■ .-^^f^ ID einer zu. startenden KR an die CT mit der 
eindeutigen ID CT# gesendet. Das Senden des Triggers 
geschieht dabei zunachst an die direkt iibergeordnete CT, 
die entsprechend der CT# den Trigger an eine wiederum 
untergeordnete CT innerhalb ihres • CT-Raumes sendet oder 
an die ihrerseits ubergeordnete CT (siehe CT- 
Hierarchien) . Erreicht der Befehl die TARGET quittiert 
diese den Empfang. 

Beim Durchlauf des Befehls durch eine CT wird eine 
Prioritatskennung des Befehls jeweils um eines erhoht. 
Trifft die Weiterleitungsanforderung eines Befehls auf 
eine weitere Anforderung innerhalb einer CT, wird der 
Befehl mit der niedersten PrioritSt zufuckgewiesen. 
Dadurch wird 

a) , sichergestellt, dafi innerhalb eines iiberschneidenden 
Systemes nur ein Befehl zu einer Zeit ausgebreitet wird 
und dadurch auch nur eine KR gestartet wird, was zu der 
geforderten Deadlockf reiheit fiihrt, 

b) sichergestellt, dafi der bislang am wenigsten weit 
ausgebreitete Befehl zuruckgewiesen wird, was zu einer 
Steigerung der Performance fuhren kann 

Nach Zuriickweisen eines Befehls, werden alle 
vorhergehenden Befehle innerhalb der GETCTS/LOOSECTS 
ebenfalls zuruckgewiesen, d.h. INITIATOR sendet an alle 
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TARGET das Signal DISMISS und die Ausfuhrung der KR 
startet nach einer Wartezeit bei. GETCTS erneut.. 
Die Quittierungen aller Trigger innerhalb eines 
Befehlsabschnittes GETCTS .\ : ' LOOSECTS werderi -an die 
INITIATOR~CT gesendet. Bei jeder eintreffendea . 
Quittierung wird die Verarbeitung des nachsten Befehls 
fortgesetzt . 

Bei Erreichen des Befehls LOOSECTS sendet INITIATOR an 
alle TARGET das Signal GO. Dadurch starten die TARGET- 
CTs die Ausfuhrung der KR mit der von Trigger.. .... 

iibertragenen ID. 

TARGETS wechseln nach Auftreten eines Triggers in einen 
Zustand, in welchem sie auf . das Auftreten eines GO oder . 
DISMISS Signales warten. 

Aufgrund der besseren Implementierbarkeit wird weiterhin 
ein leicht modif iziertes Verfahren vorgestellt: 
Zwischen den CTs einer Gruppe einer Hierarchieebene 
befindet sich ein Bussystem (Inter-CT-Bus) . Dieses 
Bussystem verbindet alle CTs der Gruppe und eine direkt 
der Gruppe iibergeordnete CT. 

Durch den Befehl GETBUS, der funktionell GETCTS ahnlich 
ist, wird das Bussystem von einer CT arbitriert. Die 
Befehle werden iiber das Bussystem an die CTs derselben 
Gruppe weitergeleitet. Befindet sich die adressierte CT# 
nicht innerhalb der Gruppe, wird durch die Iibergeordnete 
CT automatisch deren ubergeordneter Bus arbitriert und 
der Befehl weitergeleitet. Die arbitrierten Busse 
bleiben INITIATOR zugeordnet und somit fur alle anderen 
CTs gesperrt, bis entweder eine Zuriickweisung erfolgt, 
Oder der Befehl LOOSEBUS den Bus auflSst. LOOSEBUS ist 
mit LOOSECTS vergleichbar . Vor Ausfuhren des Befehls 
LOOSEBUS wird das GO~Signales an alle beteiligten Cts 
gesendet. Dies erfolgt entweder durch den Befehl 
LOOSEBUS Oder einen speziellen vorgeschalteten Befehl. 
Befehle, i.b. Trigger werden ebenfalls gemaii des bereits 
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beschriebenen Grundverf ahrens verarbeitet . Eine 
Zuruckweisiang erfolgt, wenn ein Bussystem nicht 
arbitriert werden kann. Beim Arbitrieren sind die CTs 
eiriei: Ebene . jeweils gleich p 

ubergeordnete CT besitzt eine hohere. Prioritat 
Beim Senden eines Befehls iiber den Inter~CT-Bus bleibt 
der Befehl so lange aktiv, bis die adressierte CT den 
Befehl akzeptiert (ACCEPT) oder zuruckweist (REJECT) . 

Der priorisierte Round-Robin-Arbiter 

Der priorisierte Round-Robin-Arbiter (Single-Cycle- 
Round-Robin-Arbiter SCRR-ARB) ist taktsynchron 
aufgebautr dih. bei jeder ^ je. liach Implementierung 
positiven oder negativen - Taktflanke (TFl) liefert er 
ein Ergebnis. Die eingehenden Signale (ARB-IN) 
durchlauf en eine Maske (ARB-MASK) , die von dem Arbiter 
gemali dem nachfolgend beschriebenen Verfahren selbst 
verwaltet wird. Die Ausgangssignale der Maske werden an 
einen Prioritatsarbiter (ARB-PRIG) nach dem Stand der 
Technik geleitet. Der Arbiter liefert taktsynchron bei 
jeder Taktflanke (TFl) ein Ergebnis (ARB-OUT), d.h. den 
Binarwert des hochstpriorisierten Signals nach der Maske 
(ARB-MASK) . Dem Ergebnis zugeordnet ist ein Signal 
(VALID), das angibt, ob der Binarwert. gultig oder 
ungiiltig ist. Abhangig von der Implementierung der 
Prioritatsarbiters ist es moglich^ daB beim Anliegen des 
Signals. 0 und beim Anliegen keines Sigriais derselbe 
Binarwert generiert wird: In diesem Fall zeigt VALID an, 
daB das Ergebnis ungiiltig ist, sofern' kein Signal 
anliegt. Dieses Signal wird 

1. als Ergebnis der Arbiters ausgegeben 
und 

2. auf einen Dekoder geschaltet, der die BinMrwerte - 
wie in der f olgenden . Tabelle beispielsweise fiir einen 3- 
bit Binarwert angeben - auskodiert . (Das 
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Kodierungsverfahren ist gemaB dieses Prinzips.auf jeden 
beliebigen Binarwert anpaBbar) .:. 



BinSrwert 


Auskodierung 


Bemerkung 


(ARB-OUT) 


(ARB-DEC) . = 




111 


Olli 1111 




110 


0011 1111 




101 


0001 1111 




100 


0000 1111 




Oil 


0000 0111 




olo ■ 


0000 0011 




001 


0000 0001 




000 


1111 1111 


Reset-Zustand und 

wenn Binarwert . (ARB-OUT) ungiiltig 



Dem Dekoder zugeordnet ist ein Register (ARB-REG), das 
die auskodierten Werte (ARB-DEC) des Dekoders bei der zu 
TFl inversen Taktflanke (TF2) iiberniramt . ARB-DEC wird 
auf die Maske (ARB-MASK) zuriickgekoppelt und schaltet 
die einzelnen Eingangssignale (ARB-IN) frei. 

Der funktionale Ablauf im Arbiter ist wie folgt: 

1. Nach einem RESET sind alle ARB-IN Obex ARB-MASK 
freigeschaltet, da ARB-DEC alle Signale auf 
"Freigabe" stent. 

2. Das hSchst priorisierte gesetzte ARB-IN 
(beispielsweise. besitzt in der obigen Tabelle das 
Signal 7 (binSr 111) die hochste PrioritSt und 0 
(binar 000) die niederste Prioritat) wird als 
Binarwert ausgegeben. 

3. liber ARB-DEC wird das Signal gesperrt, sowie alle 
weiteren Eingange die evtl. noch hoher priorisiert 
wSren, aber nicht gesetzt sind. 

4. Die folgenden Schritte 5 und 6 wiederholen sich so 
lange, bis das Signal 0 (binar 000) erreicht ist, 
Oder kein Signal hinter ARB-MASK mehr anliegt. Dann 
schaltet ARB-DEC (siehe Auskodierungstabelle) wieder 
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alle Signale durch ARB-MASK uber ARB-DEC. frei unci der 
Ablauf beginnt bei Schritt 2. 

5. Das nunmehr hochst priorisierte gesetzte ARB-IN wird 
als Binarwert ausgegeben. . ' : . 

6, Uber. ARB-DEC wird das Signal gesperrt, sowie alle. 
weitereh Eingange die evtl. noch hoher priorisiert 
waren, aber nicht gesetzt sind. (Weiter mit Schritt 
4) 

Dadurch wird erreicht,. ,dafi.alle Eingangssignale 
gleichberechtigt behandelt warden und bei jedem 
Taktzyklus eines der Eingangssignale (ARB-IN) binSr 
auskodiert und. ausgegeben (ARB-OUT.) wird. . 
ARB-REG kann mit einem Enable-Eingang (EN) versehen 
werden, der eine Anderung des Registerinhaltes nur bei 
TF2 zulafit, wenn ein entsprechendes Signal anliegt. 
Dadurch wird nicht bei jedem Takt ein Binarvektor 
ausgegeben, sondern abhangig von einer Freischaltung 
durch EN und TF2. Der Eingang wird zur Synchronisation 
notwendig, wenn die nachgeordnete Schaltung die 
Verarbeitung nicht in einem Taktzyklus durchfiihren kann, 
sondern mehrere Zyklen benotigt und erst dann den 
nachsten Binarvektor akzeptiert. 

Unter Umstanden ist es sinnvoll eine Reih^ von Signalen 
durch den Arbiter als hoher priorisiert anzusehen,. 
wahrend die Mehrzahl der Signale gleichpriorisiert ist. 
Dies ist z.B. bei dem vorhergehend beschriebenen 
Verfahren zur Weiterleitung von Signalen zwischen CTs 
notwendig. Urn ein Signal hSher zu priorisieren, wird der 
hochstpriorisierte Anschluli des ARB-PRIO nicht maskiert, 
d.h. an der Maske (ARB-MASK) vorbeigeleitet . Dadurch 
wird das Signal bevorzugt behandelt. 

Aufbau einer CT auf Basis eines Mikrokontrollers 

Abweichend von den bisherigen Beschreibungen kann eine 
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CT auch in einer Mikrokontrollerarchitektur 
implement iert werden. 

Es ist leicht einsehbar, daB die Grundfunktionen, wie 
* triggersteuerurigv Lookup-Tabelle LUTl und LUT2, sowie 
die Interr-CT.-Kommunikation und das Schreiben. der KW. an . 
die CEL ohne weiteres auch von einem Mikrokontroller 
ausgefiihrt werden konnen. Lediglich der Aufbau eines 
effizienten FILMOs stellt ein Problem dar, das sich vor 
allem in der erreichbaren Performance bemerkbar macht. 
Daher wird auf den Aufbau. des FILMOs .ge sonde rt .... 
eingegangen . 

Aufbau des FILMOs 

Der FILMO ist nicht als separater Speicher ausgestaltet . 
Vielmehr ist der gewohnliche Programmspeicher urn die 
FILMO-Funktionalitat erweitert. Dazu wird ein 
zusatzliches Bit (FILMO-BIT) jedem KW zugeordnet, das 
anzeigt, ob das entsprechende KW in die CEL geschrieben 
wurde oder nicht. Ist FILMO-BIT gesetzt, wird das 
entsprechende KW nicht ausgefiihrt. Beim Schreiben eines 
Kws in den Speicher wird das FILMO-BIT zuruckgesetzt . 
Alle KRs innerhalb einer CT werden iiber eine Verkettete- 
Liste (FILMO-LIST) in der Reihenfolge miteinander 
verbunden, wie sie durch Trigger oder L07yD<ID> 
aufgerufen wurden. Eine KR bleibt so lange in der FILMO- 
LIST, bis sie komplett ausgefiihrt wurde, dann wird sie 
aus der Liste entfernt. Die FILMO-LIST wird entsprechend 
des FILMO-Verfahrens durchlaufen und stellt damit einen 
direkten Ersatz fiir den FILMO-Speicher dar. 
(Der Vollstandigkeit halber sei angemerkt, dali entgegen 
des urspriinglichen FILMO-Verfahrens keine KR zweimal in 
der Liste vorkommen kann. Wird eine KR aufgerufen, die 
noch in der FILMO-LIST steht, muB deren Ausfiihrung so 
lange verzogert werden, bis sie aus der FILMO-LIST 
entfernt wurde.) 
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Der Aufbau eiher FILMO-Speicherstelle ist wie folgt; 



FILMO-BIT KW 



Befehlo; : 

Der Mikrokontroller untersttitzt die folgenden Befehle, 

die direkten Einfluli auf das FILMO haben: 

PUSH Schreiben eines KW an eine CEL 

PUSHSF Schreiben eines KW an eine CEL und setzen des 

. . FILMO-BITS:, wenn das KW angenommen 
(ACCEPT) wurde 

PUSHRET Schreiben eines KW an eine CEL und ROcksprurig 
(RETURN) aus der Unterroutine,. wenn das KW. 
nicht von der CEL angenonunen wurde (REJECT) . 
Dieser Befehl wird verwendet, wenn 
nachfolgende KW in der KR von der 
Konfiguration dieses KWs (ACCEPT) abhangig 
sind; durch den Rucksprung aus dem KR wird 
deren Konfiguration so lange verhindert, bis 
PUSHRET erfolgreich (ACCEPT) ist. 

PUSHNR Schreiben eines KW an eine CEL, nur dann, wenn 
zuvor innerhalb der KR kein REJECT auftrat. 
Dient ahnlich wie PUSHRET dazu, Abhangigkeiten 
in der. Konfigurationsreihenfolge von KWs zu 
handhaben. 

Garbage Kollektpr 

Entsprechend der bisherigen Beschreibung wird ein 
Garbage-Kollektor (GC) zum Entfernen von nicht mehr 
benotigten KRs benutzt. Der GC lauft an, wenn entweder 
der Platz zum Laden einer neuen KR im Speicher nicht 
mehr ausreicht und IDs entfernt werden miissen; oder eine 
KR explizit durch den Befehl REMOVE - mit der Angabe der 
ID der zu loschenden KR - geloscht wird. 
Urn den GC-Lauf moglichst einfach zu gestalten, werden 
samtliche KRs iiber eine verkettete Liste miteinander 
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verbunden. GC lauft die Liste durch und entfernt die 
nicht mehr b^riotigten^ K^^^^ indein s.ie ypn . anderen KR . 
uberschrieben und die Listeneintrage entsprechend 
ahgepafilt werden. babei wisrden die aile verbleibenden KR 
im Speicher so yerschoben, daB die: durch die zu ■ 
loschenden KR entstehende Speicherliicke geschlossen wird 
und am Ende des Speichers ein groBerer zusammenhangender 
Freiraum entsteht. 

Aufbau elner KR 

Ein moglicher Grundaufbau einer KR ist in der folgenden 
Tabelle dargestellt: 

. jmp START; 

length 

garbage - previous 
garbage - next 
FILMO - previo us 

FILMO - NEXT 

CACHE - statistic 
KR - statistic 
START: 



ret; 



Zu Beginn der KR erfolgt ein Sprung iiber den folgenden 
Header hinweg zum Start der Befehlssequenzen. Es folgt 
die doppelt verkettete Liste ftir cien Garbage-Kollektor, 
in der samtliche KR miteinander verbunden sind. 
"length" gibt die Lange der KR an. Diese Information 
kann fur Block-Move-Befehle nach dem Stand der Technik 
verwendet werden, die Anwendung finden, wenn die KR im 
Speicher bewegt werden mussen (Garbage, Load, etc.). 
In der anschlieBenden doppelt verketteten Liste ist der 
FILMO aufgebaut, wobei nur die KRs miteinander verbunden . 
sind, die KWs enthalten, die noch nicht an die CEL 
geschrieben wurden. 
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Es folgt eine Statistik iiber das Cache-Verhalten, die. 
beispielsweise die Anzahl der Aufrufe der KR. (pro Aufruf. 
wird der Wert um 1 erhoht), das Alter (anhand der Anzahl 
der GC-Laijfe liber die KR meBbarV pro GC--Lauf wird der • 
Wert um 1 erhoht) , etc, enthalt. Diese Statistik kann. 
der GC auswerten, wenn aus Speicherplatzgrunden eine KR 
entfernt werden muB. Fiir das Cachen ergeben sich durch 
solche Statistiken erhebliche Vorteile. So kann 
beispielsweise abhangig vom verwendeten Cache- 
Algorithmus, entsprechend den Anforderungen der ... .. 
Applikation, der Mikrokontroller so programmiert werden, 
daft 

1. die alteste/neueste KR .. 

2. die kleinste/grofite KR (s. Eintrag "length") 

3. die am seltensten/am haufigsten aufgerufene KR 
aus dem Cache geloscht wird, wenn freier Speicher 
benotigt wird. Dabei konnen selbstverstandliche weitere 
sinnvolle Statusinformationen gespeichert werden, Ein 
derart selektives Cachen ist bei heute bekannten Cache- 
Strukturen nicht moglich. Insbesondere werden frei 
programmierbare Cachealgorithmen in Caches nach dem 
Stand der Technik nicht unterstutzt. 

AbschlieBend ist eine KR-Statistik vorhanden, die 
beispielsweise die Anzahl der noch nicht konf igurierten 
(REJECT) Oder der konf igurierten (ACCEPT) KWs enthSlt . 
Gleichzeitig kann die Adresse des ersten noch zu 
konf igurierten KW gespeichert werden. Dies hat den 
Vorteil, dafi bei einem FILMO-Durchlauf direkt auf das KW 
gesprungen werden kann und nicht das. komplette KR 
durchlaufen werden muB, was zu einer erheblichen 
Perf ormancesteigerung f uhrt . 

AbschlieBend sei zu den KR angemerkt, daB die 
verketteten Liste vorzugsweise durch Eintrag der 
Vorganger/Nachfolger-ID aufgebaut werden, da damit die 
absoluten Speicheradressen ohne Probleme vom GC 
verschoben werden konnen. Innerhalb einer KR sollten nur 
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relative Sprunge anstatt absoluter Sprunge verwendet 
werden , urn P rpbleme beim Laden der.. KR . und bei . GCTLauf en 
zu vermeiden, da sich die absolute Adressen dabei 
veranderri- 

Der Vollstandigkeit halber soil noch erwahnt werden, dafi 
gemaB dem bereits beschriebenen Prinzip auch beim 
Einsatz eines Mikrokontrollers vor dem Ausfiihren einer 
neuen KR (aufgrund eines Triggers oder Befehls, auch von 
einer anderen CT aus) der. FILMO durchlaufen wird und vor 
Durchlauf des FILMOs der Zustand der CEL 
(umkonf igurierbar oder nicht) gesichert wird; 



Figuren 

Die nachfolgend beschriebenen Figuren verdeutlichen 
anhand eines Implementationsbeispiels die Verwaltung von 
Konfigurationsdaten nach dem vorgestellten Verfahren: 

Figur 1: Verfahren der Adressgenerierung innerhalb der 
Lookup-Tabellen 

Figur 2-7 Abarbeitung der Befehle und Funktion der 
Statemachinen 

Figur 8 : Auf bau des SCRR-ARB 
Figur 9: Auf bau der LUTl & LUT2 

Figur 10: Auf bau der Pointerarithmetik und des CTR 

Figur 11: Auf bau einest FILMO 

Figur 12a: Hierarchische Anordnung der CTs 

Figur 12b: Senden eines Triggers zwischen den CTs 

Figur 12c, d: Methoden zum Senden eines 

Figur 13: Aufruf einer KR durch mehrere IKR 

Figur 14: Aufbau der LUTl einer ROOT-CT 

Figur 15: Aufbau der HOST-Steuerung einer ROOT-CT 

Figur 16: Verdeutlichung des LUT und ECR Konzeptes 

Figur 17: Ablauf steuerung einer CT mittlerer 

Hierarchieebene, bzw. einer ROOT-CT 
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Figur 18: Deadlockproblematik bei der Konf iguration 
eines 2-dimens.ionalen Arrays C ... 
Figur 19: Verdeutlichung des FILMO-Konzeptes 
• Figur 20: Grundprinzip der inter-CT-koiranunikation 
Figur 21: Implemetierungsbeispiel der Inter-^CT-; ■ . 
Koimnunikation nach dem GETCTS-Verf ahren 
Figur 22: Implemetierungsbeispiel der Inter-CT- 
Kommunikation nach dem GETBUS-Verfahren 
Figur 23: Busstruktur des Inter-CT-Bus 
,Figui: .24: Adressierung innerhalb von CT.-Hierarchien . 
Figur 25: GARBAGE-Liste . 
Figur. 26: FILMO-Liste 

Figur 27 : FILMO. Funktion innerhalb einer KR 

Figur 28: Speichern der Zustande vor Ausfiihren einer KR 

Oder des FILMOs. 

Beschreibung der Flguren 

Figur 1 zeigt den Ablauf der CTR-Adressgenerierung 
innerhalb einer CT. Dabei wird ein eingehender binarer 
Triggervektor (0101) in der LUTl auf eine giiltige KR 
Oder IKR ID ubersetzt. Existiert keine giiltige ID, wird 
ein Signal "Illegal Trigger" generiert (0102), das 
anzeigt, dafi der Trigger nicht in LUTl bekannt ist. Das 
Signal kann als Fehlermeldung an die iibergeordnete CT 
weitergeleitet Oder ignoriert werden. Die Ubersetzung 
von "Trigger" nach "ID" wird mittels des Befehls 
"REFERENCE" in- die LUTl eingetrageh. 

Eine gultige ID (0103) wird an die LUT2 weitergeleitet. 
IDs die innerhalb von Befehlen, also durch einen 
Operanden, angegeben sind (0104), treffen direkt auf die 
LUT2. Die LUT2 ubersetzt eine eingehende ID in die 
Adresse der KR/IKR innerhalb des CTR, Ist die KR/IKR 
nicht im CTR gespeichert (es liegt im Cache nicht vor) , 
wird das Signal "Miss" generiert (0105) . 1st die 
iibersetzte Adresse der KR/IKR mit dem Token "NoAdr" 
markiert, wird mit "NoEntry" (0107) angezeigt, daB die 
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Adresse geloscht ist. "Miss" und "NoEntry" zeigen an, 
daB eine Ubersetzung auf eine CTR-interne Adresse nicht 
moglich ist. Auf Grundlage dieses Signals ladt die LOAD- 
Statemachine die KR/IKR mit der entsprechendeh ID Von / 
einer daruberliegenden CT nach.' 

Sdferii eine gultige Adresse vorhanden ist, wird diese an 
die Pointerarithmetik des Adressgenerators 
weitergeleitet (0106) . In LUTl wird ein eingehender 
binarer Triggervektor entweder in eine ID oder einen 
weiteren Triggervektor ubersetzt/ wobei in diesem Fall 
der Triggervektor ausgegeben wird (0108) . 

In Figur 2 ist der Ablauf beim Laden einer KR/IKR 
dargestellt. Zunachst wird die ID (0201) der zu ladenden 
KR/IKR an die darxtoerliegende CT gesendet. Daraufhin 
wird in die LUT2 an der Stelle des Eintrages fur die 
angeforderte ID der Wert des FreePointers (FP) 
eingetragen. FP zeigt auf den Eintrag hinter dein letzten 
fiir eine KR/IKR genutzen Eintrag im CTR. Dies ist der 
erste Eintrag, auf den die zu ladende KR/IKR gespeichert 
wird. 

Die Statemachine wartet auf ein Datenwort von der 
driiberliegenden CT. Sobald das Wort verfiigbar ist, wird 
es an die durch FP ref erenzierte Stelle geschrieben. FP 
wird inkrementiert . Zeigt FP auf einen Eintrag hinter 
dem Ende des CTR wird der erste Eintrag im CTR entfernt 
urn Platz zu. schaffen (0202) ; dabei wird FP aktualisiert • 
Ist das von der dartiberliegenen CT gesendete Datenwort 
"STOP", wird der Ladevorgang abgebrochen (0203), 
ansonsten mit dem Warten auf ein neues Datenwort 
fortgesetzt (0204) . 

In Figur 3a ist der "MASK"^Bef ehl dargestellt. Der 
Operand des Befehls wird in das MASK-Register 
geschrieben. Das MASK-Register befindet sich am Eingang 
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der Triggersignale vor LUTl und maskiert ungiiltige . 
Triggei: aus. 

In Figur 3b wird durch den Befehl "TRIGGER" der Operand 
des Befehis als triggervektor zu den anderen GTs 
abgesendet. . . 

In Figur 3c wird durch den Befehl "REFERENCE" die 
Ubersetzung eines Triggers zu der entsprechenden KR/IKR 
ID in die LUTl geschrieben. 

In Figur .44 wir der Befehl "WAIT?" . dargestellt . Der 
Operand des Befehis wird. in das WAITMASK-Register 
geschrieben. AHe Trigger, bis auf den/die ErWarteten 
und daher in WAITMASK f reigeschalteten werden ignoriert. 
Erst nach Auftreten des Triggers wird zum Programmf lufi 
zuruckgekehrt - 

In Figur 4b ist der "PUSH"~Befehl abgebildet. Das 
Konf igurationswort wird zum adressierten 
konfigurierbaren Element (CEL) gesendet, Akzeptiert das 
CEL das Konf igurationswort nicht; da das GEL sich 
beispielsweise im Zustand "nicht konf igurierbar" 
befindet; wird das Konf igurationswort in den FILMO 
geschrieben (0401) . 

Figur 5 zeigt den M)lauf eines " REMOVE " -Befehle s . Es 
gibt zwei Auf ruf varianten : 

1, Die erste im CTR liegende KR/IKR wird aus dem CTR 
entfernt* Dem GarbagePointef (GPj wird die Adresse 0 des 
CTR zugewiesen (0501) . 

2. Eine spezifisch durch ihre ID angegebene KR/IKR wird 
aus dem CTR entfernt. Dem GarbagePointer (GP) wird die 
erste Adresse des zu entfernenden KR/IKR im CTR 
zugewiesen (0502) . 

Der MovePointer wird mit dem Wert von GP geladen. GP und 
MP referenzieren auf einen "BEGIN <ID>" -Befehl im CTR, 
auch wenn die erste KR/IKR aus dem CTR entfernt werden 
soil. Die betreffende ID wird in LUT2 als ungiiltig 
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markiert, MP wird so lange inkrementiert, bis das "BEGIN 
<ID>" des nachsten iin Speicher liegenden KR/IKR erreicht 
wird (0503), ODER MP gleich dem FreePointer (FP) ist, 
da.s bedeutet, dafi die. zu. entfernende KR/IKR die letzte 
im CTR ist (0504) .... . 

- In diesem Fall wird FP mit dem Wert von GP geladen, 
wodurch die durch die zu loschende KR/IKR belegten 
Speicherstellen als frei markiert warden; und die 
Funktion "REMOVE" ist beendet (0505) . 

- Andernfails ("BEGIN <ID>" wird erreicht (0506)) werden 
die durch MP ref erenzierten Daten an die durch GP 
referenzierte Speicherstelle kopiert. MP und GP werden 
inkremetiert • Dieser. Ablauf findet so lange statt, bis 
MP das Ende von CTR oder die Position von FP erreicht 
hat (0507) . Wird wahrend des Ablauf es durch MP eine 
Speicherstelle referenziert, in der "BEGIN <ID>" steht, 
wird der Eintrag fiir die entsprechende ID in LUT2 mit MP 
iiberschrieben (0508) , damit bei einem Lookup die 
richtige Speicherstelle ausgegeben wird. 

Figur 6 zeigt das Ablauf diagram des FILMOs. Ein FILMO 
beinhaltet drei Pointer: 

1. WriteP: Der Schreibzeiger des FILMO-RAM 

2. ReadP: Der Lesezeiger des FILMO-RAM 

3. FullP: Der Zustandszeiger, der den "Fiillstand" des 
FILMO-RAMs reprasentiert und einen Unterlauf , bzw. 
Uberlauf verhindert. 

Ein ein-Bit Register "BeginF" zeigt an, ob sich der 
aktuelle Lesezugriff am Anfang des FILMO-RAMs befindet 
(TRUE), d.h. keine nicht geloschten Eintrage befinden 
sich zwischen dem Lesezeiger und. dem Beginn des FILMO- 
RAMs; Oder sich der Lesezeiger in der Mitte des FILMO- 
RAMS befindet (FALSE), also benutzte Eintrage zwischen 
dem Lesezeiger und dem Beginn des FILMO-RAMS liegen. 
Weiterhin existieren zwei Register zum Speichern der 
Zustande des ReadP und FullP. Es' ist notwendig beim 
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Auftreten des ersten ungelSschten Eintrages die beiden 
Reg^ister zi? sichern, da bei eine^ stattfindenden 
Lesezugriff an der Stelle dieses Eintrages mit dem 
Auslesen begdnnen warden muI5; -A^^ miissen jedoch 

ReadP und. FullP . wahrend des aktuellen Lesevorganges 
weiterhin modifiziert werden, um die nachsten 
Leseadressen zu erhalten, bzw. das Ende des FILMO-RAMs 
festzustellen. Durch den Aufbau des FILMOs als FIFO- 

ahnliche Struktur als sogenannten Ringspeicher 

kann Beginn und Ende des Speichers . nicht anhand einer 
Adresse 0 oder eine Maximaladresse festgelegt werden. 
Aus dem Grundzustand fuhren zwei Ablaufpfade: 
1. Lesepf ad . (0601) 

FullP und ReadP werden in die Register gesichert. 
Die Abarbeitungsschleife beginnt: 
BeginF ist TRUE. 

1st FullP gleich 0, werden ReadP und FullP aus ihren 
Registern zuruckgelesen (0602) und die Statemachine 
springt in den Grundzustand zuriick. 

Ansonsten (0603) wird getestet, ob der Eintrag im FILMO, 
auf den ReadP zeigt gleich "NOP" ist, d.h. es handelt 
sich um einen als geloscht markierten Eintrag in der 
Mitte des FILMOs. Ist dies nicht der Fall (0604) wird 
versucht den Eintrag in das konfigurierbare Element 
(CEL) zu schreiben. Gelingt dies nicht (REJECTr 0605), 
da CEL nicht umkonf igurierbar ist, wird Beg;inF auf FALSE 
gesetzt, FullP dekrementiert und Read? inkrementiert.. 
Die Statemachine springt an den Beginn der 
Abarbeitungsschleife (0606) . 

Gelingt das Schreiben des Eintrages an das CEL (0607), 
Oder der Eintrag ist ein NOP, wird BeginF gestestet: 
BeginF == TRUE (0608) : Es liegen keine ungeloschten 
Eintrage vor diesem. FullP wird inkrementiert, ReadP 
wird in dem zugeordneten Register gesichert, um den 
neuen Anfang des FILMOs festzuhalten. FullP wird 
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gesichert urn die aktuelle Datenmenge festzuhalten; ReadP 
wird inkrementiert 

BeginF == FALSE (0609) : FullP wird inkrementiert und der 

Eintrag im FIIjIlb-RAM .NOP uberschrieben^ 
.d.h. der Eintrag wird- gelSscht.. Read? wird 
inkrementiert. 

In beiden Fallen springt die Statemachine an den Beginn 
der Abarbeitungsschleife. 
2. Schreibpfad (0610) 
. Es wird. getestet, ob der FILMO-RAM voll ist, indem Full? 
auf den maximalen Wert iiberprUft wird. 1st dies der Fall 
(0611), wird in den Lesepfad gesprungen urn Platz zu 
schaf fen. 

Ansonsten wird das Datenwort in den FILMO-RAM 
geschrieben und WriteP und FullP inkrementiert. 

Pigur 7 zeigt den Ablauf in der Haupt statemachine . Der 
Grundzustand (IDLE) wird verlassen, sobald ein 

1. REMOVE -Kommando von der daruberliegenden CT auftritt 
(0701) : Der REMOVE-Bef ehl wird ausgefuhrt und die 
Statemachine kehrt nach IDLE zuriick. 

2. Ein Triggersignal zur Generierung eines Triggers 
zwischen den CTs auftritt (0702) : 

Der Trigger wird ausgegeben. 

Die Statemachine springt in den "STOP "-Bef ehl und danach 
nach IDLE zuriick. 

• . 3, Eiii Triggers igna?. zur Ausfuhrung eines KR/IKR <ID> 
auftritt (0703) : 

Der ProgramPointer (PP) wird mit der durch LUT2 
generierten Adresse geladen. 1st die Adresse ungiiltig, 
d.h. kein Eintrag fiir das zu ladende KR/IKR vorhanden, 
wird dieses geladen (0704) und PP neu gesetzt. 
Die Ausfiihrungsschleife beginnt: 

PP wird inkrementiert (beim ersten Schleifendurchlauf 
wird dadurch der BEGIN <ID>-Befehl ubersprungen) , das 
Auftreten weiterer Trigger wird unterbunden, RECONFIG 
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wird gesperrt . Die Bef ehle werden ausgef iihrt und zum 
Beginn der Ausfuhrungsschleife gesprungen (0707). 
ber Befehl "STOP" wircJ gesondert ausgefuhrt (0705) . Die 
Trigger und RECONFIG werden wieder f reigeschaitet and- 
die Statemachine springt nach IDLE. 

Der Befehl "EXECUTE" wird ebenfalls gesondert ausgefuhrt 
(0706) • Die in EXECUTE <ID> angegebene ID wird in das 
ID-REG geschrieben. PP wird neu geladen und die durch ID 
angegebene KR/IKR ausgefuhrt (0708) . 

Nach einem Reset der CT wird die Grundkonf iguration in 
das CTR geladen und direkt in die Ausfuhrung der 
Grundkonfiguration. gesprungen .(0709) . 

Figur 8 zeigt den Aufbau eines SCRR-ARB. Die zu 
arbitrierenden Signale gelangen uber Datain auf eine 
Maske (0801), die gemSfi der bekannten Tabelle einen 
zusammenhangenden Teil der Signale durchschaltet, bzw. 
sperrt, Ein gewohnlicher Prioritatsarbiter (0802) nach 
dem Stand der Technik arbitriert ein Signal aus der 
Menge der Durchgeschalteten und lieferte dessen 
Binarvektor (BinaryOut) zusammen mit einer 
gultig/ungultig-Kennung (ValidOut) (ebenfalls geraaB dem 
Stand der Technik) als Ausgang des SCRR-ARB. 
Dieses Signal wird gemaB der bekannten Tabelle dekodiert 

(0803) und auf ein Register zur Taktsynchronisierung 

(0804) . gef iihrt. Uber dieses Register wird die Datain 
Maske geschaltet, Dabei wird das Register entweder durch 
einen Takt oder ein Next-Signal (Enable EN), das den 
nachsten gultigen Binarvektor abfragt gesteuert. Bei 
einem Reset oder wenn die Kennung (ValidOut) ungtiltig 
anzeigt wird das Register so geschaltet, daB die Datain 
Maske alle Signale durchschaltet . 

Der Aufbau der Maske ist in 0805 dargestellt. In 0806 
ist die Maske ein weiteres Mai abgebildet, dabei sind 
die Signale Datain 0.. Datain 1 gemaJi des SCRR-Prinzips 
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gieichpriorisiert, wahrend Datain m ... Dataln n 
hoherpriorisiert sind. 

. ih.Pigur 9 ist die' LUT-Struktur abgebiidet. ber • 
Binarvektor. (Binaryin) des arbit.rierten Triggers wird 
auf den Adresseingang der LUTl (0901) gefuhrt. 
LUTl iibersetzt den Binarvektor entweder in einen 
giiltigen Trigger urn diesen an eine andere CT 
weiterzuleiten oder eine" gultige ID. Beide werden iiber 
0910 ausgegeben, 0911 zeigt an, ob es. sich urn einen. . 
Trigger Oder eine ID handelt. 

1st uber den Befehl .. PREFERENCE" keine Ubersetzung des 
eingehenden Binarvektprs. in -LUTl .eingetragen, wird 
mittels eines Biteintrages dder eines Vergleichers auf 

ein bestimmtes Token (z.B. "VOID") das Signal 

"Illegal Trigger" 0914 generiert. 

Ein Trigger wird iiber 0912 an externe CTs gefiihrt, IDs 
werden iiber den Multiplexer (0902) weiterverarbeitet . 
0902 schaltet entweder der Datenausgang von LUTl, der 
eine giiltige ID angibt, oder das ID-Register (0903) der 
CT auf den Adresseingang der LUT2 (0904) . 0904 besitzt 
eine Cache-ahnliche Struktur, d.h. der niederwertige 
Teil (0906) des Datenausgangs von 0902 wird auf den 
Adresseingang von 0904 geschaltet, wahrend der 
hoherweftige Teil (0907) auf den Dateneingang von 0904 
geschaltet wird. Der 0907 gehorende Datenausgang wird 
uber einen Komparator (0905) mit 0907. verglichen. .Der ■ 
Vorteil dieses Verfahrens ist, daB 0904 nicht die Tiefe 
zur Ubersetzung aller IDs aufweisen mufi, sondern 
erheblich kleiner ausf alien kann. Ahnlich eines 
gew6hnlichen Caches wird lediglich ein Teil der IDs 
ubersetzt, wobei in der LUT2 anhand 0907 festgestellt 
werden kann, ob die selektierte ID der von LUTl 
angegebenen entspricht. Dies entspricht einem Cache/TAG- 
Verfahren nach dem Stand der Technik. 
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Einem zweiten Dateneingang von 0904 ist ein Multiplexer 
°?.f^^.,.^"9eordn^t, der je nach Operation den FreePpinter . 
(FP, Operation LOAD) , den GarbagePointer (GP, Operation 
::i<Em^) Oder eine Invalid-Kennung/Tokeri (NoAdr, 
Operation REMOVE) zur Speicherung an. LUT2 . lief ert . Die 
beiden Pointer ref erenzieren auf Speicherstellen im CTR, 
"NoAdr" gibt an, daI5 kein Eintrag zu der passenden ID 
existiert/ der Eintrag geloscht wurde. Dies wird am 
Datenausgang festgestellt , indem uber den Vergleicher 
.0909. die. Daten auf das Token "NoAdr" verglichen werden. . 
An die Statemachine wird weitergeleitet : 
~ Das Auftreten eines .Binarvektors wird fiber "^Validln" , 
(vgl. Figur 8) , . . . 

- Die Angabe ob es sich bei der Ubersetzung in LUTl urn 
einen Trigger oder eine ID handelt (0911, "Trigger/ID 
Out") . Trigger werden fiber 0912 an andere CTs 
weitergeleitet, IDs werden in der eigenen CT 
abgearbeitet und an die LUT2 weitergeleitet. 

- Das Ergebnis von 0905, das angibt, ob die 
entsprechende ID in 0904 gespeichert ist ("Hit/Miss 
Out") . 

- Das Ergebnis von 0909, das angibt, ob die 
entsprechende ID auf eine gfiltige Adresse im CTR zeigt 
("NoEntry Out") . 

Die von 0904 generierte Adresse wird an das CTR 
weitergeleitet ("CTR Address Out") . 

Die LUTl wird fiber den Befehl "REFERENCE" mit der 
Ubersetzung des eingehenden Binarvektors auf einen 
Trigger oder ID geladen. Die Operanden des Befehls 
werden fiber den Bus 0913 an die LUTl geffihrt, liber 
denselben Bus wird das ID-Register (0909) geladen. 

Figur 10 zeigt die Pointerarithmetik des GarbagePointer 
(PG), ProgramPointer (PP) , MovePointer (MP) und 
Fre.ePointer (FP) . Jeder Pointer besteht aus einem 
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getrennt ansteuerbaren ladbaren up/down-Zahler . Jeder 
Zahler k^nn 'r~ sofern not^endig — — mit, dem .Wert, jedes^ 
anderen zahlers geladen warden; ebenso wie mit der 
Ausgabe von LUliz (1007) . 

Uber Vergleicher wird; festgest.ellt ob. . 

1. PP gleich MP 

2. MP gleich FP 

3. FP gleich der maxiraalen Position im CTR 
ist. Die Ergebnisse werden zur Steuerung der 
Statemachines.verwendet.. . .. 

Uber einen Multiplexer (1001) wird einer der Pointer zum 
Adresseingang des CTR geleitet. Die Oaten gelangeh iiber ^ 
einen Multiplexer (1002) entweder von der iibergeordneten 
CT (1005) Oder aus einem Register (1003) an das CTR. Zur 
Statemachine und zum FILMO (1006) werden uber einen 
Multiplexer (1004) entweder die Daten von der 
iibergeordneten CT Oder des CTR weitergeleitet . Dabei 
wird beim Auftreten eines REMOVE-Befehls von der 
iibergeordneten CT der direkt uber 1004 an die 
Statemachine geleitet, wahrend ansonsten die Befehle aus 
dem CTR an die Statemachine gefuhrt werden. Das Register 
1003 dient zur Speicherung und Riickkopplung von Befehlen 
auf den CTR Eingang, die wahrend eines Durchlaufs des 
Garbage-Kollektors von einer Adresse an eine andere 
geschoben werden • 

Der Aufbau eines FILMOs ist in Figur 11 dargestellt. Die . 
Daten gelangen von dem CTR (1101) in das FILMO und 
werden entwerder iiber den Multiplexer (1102) in das 
FILMO-RAM (1103) geschrieben oder iiber den Multiplexer 

(1104) an die konf igruierbaren Elemente (1116) gesendet. 
Werden Daten in 1103 gelSscht, wird Ober 1102 eine 
"NOP"-Token nach 1103 geschrieben. Uber den Vergleicher 

(1105) am Datenausgang wird das "NOP"-Token erkannt und 
ein Schreiben zu den konf igurierbaren Elementen 
verhindert. Uber den Multiplexer 1106 wird entweder der 
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Schreibzeiger WriteP (1107) oder der . Lesezeiger (1108) 
f?®" yon 1103 gefiihrt.. In dem Register. 
1109 wird der Lesezeiger gesichert urn ein Rucksetzen 
(siehe. Figur 6) zu .ermogiichen. . • ' 
Per Fullstandszahler Full (1110) von 1103 .wird gemafi. 
Figur 6 in dem Register 1111 zum Rucksetzen gespeichert. 
Zwei Vergleicher testen, ob 1103 leer (1112) oder voll 
(1113) ist. Uber den Multiplexer 1115 wird selektiert, 
ob die Steuersignale der Statemachine (von 1101) oder 
des FILMOs an 1116 gesendet wird* 

Figur 12a zeigt den hierarchischen Aufbauder CTs . Alle 
CTs beziehen ihre Daten aus der ROOT-CT (1201) und dem 
ihr zugeordneten ECR (1204) . Fiir jede 

Implementierungsebene in einem Baustein existiert eine 
Oder mehrere CTs. Jede CT ist fur die Verwaltung ihrer 
Ebene und der darunterliegenden CTs zustandig. Es ist 
nicht notwendig, dafi alle Aste das.Baumes gleich tief 
sind. Beispielsweise konnen weniger Ebenen zur Steuerung 
der Peripherie (1202) eines Bausteines existieren als 
zur Steuerung der Arbeitseinheiten (1203) . Der 
Datentransfer erfolgt baumartig. Jede CT arbeitet als 
Cache fur alle unter ihr liegenden CTs. 
Figur 12b zeigt den Triggerflufi zwis.chen den CTs. 
Wahrend der DatenfluB baumartig verlauft, ist der 
TriggerfluB nicht festgelegt. Jede CT kann an jede . 
andere einen Trigger senden. Fur gewohnlich: findet ein 
Triggeraustausch nur von den Slattern (1203) in Richtung 
der ROOT-CT (1201) statt . Unter Umstanden kann der 
Transfer jedoch auch in die entgegengesetzte Richtung 
verlaufen. 

In Figur 12c ist ein Triggervektor Broadcast 
dargestellt, wobei .1205 einen Triggervektor an alle CTs 
sendet . 
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Figur 12d zeigt einen HIGHER-Triggervektor, den 1206 an 
die uber ihr liegende CT sendet . 1207 sendet einen 
LOWER-Triggervektor an alle unter ihr liegenden CTs . 
1208* iibertragt einen difekt .adressierten , (ADDRESSED) 
Triggervektpr an eine bestirrante . CT,.. die nicht direkt mit 
1207 verbunden ist. 

In Figur 13 fordern zwei unabhangige IKR n und m eine 
gemeinsame, -in der darflberliegenden CT gecachte KRx an. 
Es ist angedeutet, dafi diese KR von dem. gesamten Ast 
gecachet wird und auch in einem Nachbarast (1301) iiber 
eine gemeinsame CT verfugbar ist. 

Figur 14 zeigt ein gegeniiber Figur 9 modif iziertes LUT- 
System, das in ROOT-CTs und CTs mittlerer 
Hierarchieebenen verwendet wird. Der grundlegende 
Unterschied zu den bislang beschriebenen CTs ist, dafi 
anstatt einzelner Triggersignale ID- und/oder Trigger- 
Vektoren von der CT verwaltet werden mussen. Jedem 
Vektor ist dabei ein Handshake-Signal (RDY) zur Anzeige 
der Gultigkeit des Vektors zugeordnet, die an einen 
Arbiter (1401) geleitet werden. Uber die Multiplexer 
(1402, 1403) wird entweder einer der Triggervektoren 
(1404) Oder einer der ID-Vektoren (1405) ausgewahlt. 
Triggervektoren gelangen direkt auf den Adresseingang 
der LUTl (1406), die ansonsten gemafi Figur 9 beschaltet 
ist. Pas ID-Register (1407) ist ebenfallsgemafi Figur .9 
beschaltet. Im Gegensatz zu Figur 9 besitzt der 
Multiplexer 1408 drei Eingange (vgl. 0902).. Der 
Multiplexer wird dabei aufier von der Statemachine 
zusatzlich von dem Arbiter 1401 angesteuert . Uber den 
zusatzlichen Eingang werden ID-Vektoren iiber 1403 direkt 
an die LUT2 weitergeleitet . Dazu dient der Bus 1409. 
(Prinzipiell konnen auch bei CTs gemafi Figur 9 IDs gemafi 
einem Multiplexer (1408) direkt auf die LUT2 geschaltet 
werden. Die IDs konnen dann ohne Ubersetzung direkt von 
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den CEL an die LUT2 gesendet werden. ) "Trigger/ID Out" 
wird gemafi Figur 9 geneiriert . Ein "yaM^ 
gemaB Figur 9 auf ein "Valid Out" weitergeleitet wird 
existiert nicht; Statt dessen wird je nach Arbitrierung 
durch 1401 ein "Valid. Trigger Out" fur- Triggeryektoren. 
und ein "Valid ID Out" fur ID-Vektoren generiert, um die 
Statemachine anzuweisen, wie die Verarbeitung 
stattzuf inden hat. 

Der Bus 1409 wird liber 1410 an eine weitere Einheit 
geleitet,, die nur ^in der ROOT-CT existiert und in Figur. 
15 beschrieben ist. 

Eine.ROOT-CT benotigt zusStzlich zu den normalen CT- 
Funktionen. ein Interface zu . dem. externen 
Konf igurationsspeicher (ECR) , sowie den erforderlichen 
Adressgenerator und Einheiten zum Verwalten der Zugriffe 
auf den ECR. 

Eine gewohnliche CT ubersetzt in LUTl eingehende 
Triggervektoren auf einen ID und in LUT2 das ID auf eine 
Speicherstelle im CTR (siehe Figur 16a) . Eine ROOT-CT 
ubersetzt bei Zugriffen auf das ECR eine ID innerhalb 
des ECR auf eine Adresse im ECR, an der das durch ID 
referenziert KR/IKR beginnt. Dazu ist ein 
Speicherbereich im ECR festgelegt, dessen GroBe der 
moglichen Anzahl an IDs entspricht (ist beispielsweise 
eine ID 10-bit breit, ergibt das 2^^ = 1024 mSgliche IDs, 
also werden 1024 Eintrage im ECR reserviert) . In den;, 
fblgenden Beispielen befindet sich dieser 
Speicherbereich am unteren Ende des ECRs und wird LUT- 
ECR genannt, um die Ahnlichkeit zur LUT2 zu 
unterstreichen. Die Ubersetzung eines Triggers auf eine 
ID findet dabei gemaB den bereits bekannten CTs in der 
LUTl statt (1601) . Zum besseren Verstandnis verdeutlicht 
Figur 16b den Zugriff auf das ECR. 
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Eine ID gelangt in Figur 15 iiber den Bus 1410 auf Figur 
14 an den Multiplexer 1501. Uber 1501 wird die ID in den 
ladbaren Zahler 1502 geschrieben. Der Ausgang von 1502 
fiihrt liber einen Multiplexer 1503 an den Adressbus ■ 
(1504 ) des ECR. Uber. den Datenbus. 1505 gelangt die 
Ubersetzung der ID auf eine Speicheradresse iiber einen 
Multiplexer/ Demultiplexer (1506) an 1501, der 1502 mit 
der Speicheradresse ladt. Daraufhin werden uber die 
Stateinachine ■LOAD--ECR (siehe Figur 17) die Datenworter 
der entsprechenden KR/IKR, aus.dem. ECr' gelesen.und in das 
CTR geschrieben, wobei 1502 nach jedem Lesevorgang 
erhoht wird; so lange^. bis .der Befehl. "STOP" gelesen 
wurde.. 

Uber das Interface 1507 schreibt der ubergeordnete HOST 
uber 1503/1506 die KR/IKR in das ECR. Dabei wird uber 
die Statemachine (CTS) arbitriert, ob der HOST oder die 
ROOT-CT Zugriff auf das ECR hat. 

Nach einem Reset des Bausteines muB eine 
Grundkonfiguration (BOOT-KR) geladen werden. Dazu wird 
eine feste Speicheradresse (BOOT-ADR) eingefuhrt, die 
auf die erste Speicherstelle der BOOT-KR zeigt. Als 
BOOT-ADR wird die Speicherstelle Oh empfohlen, sofern 
die IDs bei 1 beginnen, andernfalls kann 2^° oder irgend 
eine andere Speicherstelle verwendet werden. In dem 
Ausfuhrungsbeispiel wird 2^0 verwendet. 

Die ROOT-CT fiihrt zum Laden der BOOT-KR an der Stelle 
BOOT-ADR einen Lookup durch, sofern eine BOOT-KR geladen 
ist. Die ROOT-CT schreibt die Daten nach 1502 uin von 
dort die BOOT-KR bis zum Auftreten eines "STOP" Befehls 
zu laden. 

Eine Uberwachungseinheit innerhalb der ROOT-CT iibernimmt 
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die Synchronisation des HOST mit dem Baustein, Dies 
geschieht folgendermafien: 

Die Adressen kleine 2^° werden durch 1508 iiberwacht, d.h. 
bei Zugriffien auf diese Adressen durch d^n HOST wird ein 
. Signal. (ACC-ID) an die Statemachine (CTS) gesendet.. 
Ebenfalls wird BOOT-ADR iiber 1509 iiberwacht und sendet 
ein Signal ACC-BOOT an die Statemachine (CTS) . 
Die Statemachine (CTS) reagiert wie folgt: 

- Schreibt HOST auf die BOOT-ADR, bewirkt dies das Laden 
der BOOT-KR.. 

- Schreibt HOST das Datenwort 0 (1512) auf die BOOT-ADR, 
wird dies liber den Komparator 1510 festgestellt und 

. bewirkt . das Anhalten des Bausteines. 

- schreibt der HOST auf eine Adresse kleiner 2'^ wird die 
Adresse in das REMOVE-Register (1511) geladen. Da die 
Adresse der ID entspricht (siehe ECR-LUT) steht die ID 
der geanderten KR/IKR in 1511. An alle CTs wird der 
Befehl REMOVE <ID> zur sofortigen Ausfiihrung gesendet 
(1513) . Die CTs loschen daraufhin die KR/IKR der 
entsprechenden ID aus ihrem CTR, bzw. LUT2 . Bei einem 
nachfolgenden Aufruf der KR/IKR mussen die CTs 
zwangslSufig die neue KR/IKR aus dem ECR laden. 

Figur 17 zeigt den Ablauf in einer ROOT-CT bei Laden 
einer KR/IKR aus dem ECR, Befindet sich eine ID nicht im 
internen CTR (vgl. Figur 1, 1701) wird die ID in den 
Zahler 1502 geschrieben (1703) . Ein Zugriff auf das ECR . 
mit der Adresse in 1502 liefert die Basisadresse der 
KR/IKR. Diese wird in 1502 geschrieben (1704) . Ein LOAD 
gemSfi Figur 2 findet statt (1702). Dabei werden die 
Daten statt von einer Ubergeordneten CT aus dem ECR 
gelesen (1705) und nicht nur in das eigene CTR 
geschrieben, sondern an die untergeordnete CT gesendet 
(1706) . 
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In einer CT mittlerer Hierarchieebene lauft die 
Ubersetzung der Trigger ahnlich Figur 1, mit der , 
Ausnahme, daB Triggervektoren und ID-Vektoren gemaB 
Figur 14 behahdeit werden. Die KR/TKR werden geihajB Figur 
2 geladen/ mit der Ausnahme, dafi. die Datenworte nicht 
nur in das eigene CTR geschrieben werden (0210) , sondern 
gleichzeitig an die untergeordnete CT gesendet werden. 

Figur 19 verdeutlicht das FILMO Prinzip. Der FILMO 
(1901) wird bei lesenden und schr.eibenden Zugriffen^ 
invner vom Anfang zum Ende durchlaufen (1902) . Werden 
Eintrage vom Anfang des FILMOs geschrieben .und geloscht . 
(1903), wird der Lesezeiger auf den . ersten ungeloschten 
Eintrag v^rschoben (1904). Werden Eintrage aus der Mitte 
das FILMOs geschrieben (1905), bleibt der Lesezeiger 
unverandert (1906), die Eintrage werden mit "NOP" 
markiert (1907) . Werden Daten in das FILMO geschrieben 
(1908) , werden diese am Ende, hinter dem letzten Eintrag 
angehangt (1909) . Der Lesezeiger (1910) bleibt 
unverandert • 

Selbstverstandlich kann eine CT mit nur einem Speicher, 
der LUTl, LUT2 und CTR umfafit aufgebaut werden. Die 
Steuerung dafiir ist jedoch aufwendiger. Die CTs sind 
dabei Shnlich der ROOT-CT aufgebaut, die bereits die 
LUT2 UND das CTR im ECR integriert. Ftir. das Verstandnis 
des Verfahrens ist eine Beschreibung die.ser CTs nicht- 
erforderlich, 

Wird eine CT als Cachesystem fur Daten eingesetzt, 
werden Trigger zum Schreiben von Daten in das CTR 
eingeffihrt. Dabei werden die Daten von einer CEL in das 
CTR geschrieben. Die hierzu notwendigen Anderungen sind 
trivial, das FILMO kann komplett ent fallen. 
Beim Cachen der Daten tritt das Problem der 
Datenkonsistenz auf. Dies kann umgangen werden, indem 
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ein Verfahren gemaB DE 42 21 278 Al eingesetzt wird, urn 
die Daten und deren Gviltigkeit in den einzelnen 
Hierarchieebenen zu kennzeichnen . Werden Daten zur. 
Durchf uhrung eines Read-Modify-Write-Zyklusses' (RMW- ' ' 
Zyklus) angefordert, werden die Daten auf alien . . •. 
Hierarchieebenen anhand eines zusatzlichen Eintrages in 
dem CTR/ECR als "ungiiltig" (INVALID) gekennzeichnet . In 
den Eintrag kann dazu die eindeutige ID der die Daten 
benutzenden KR/IKR eingetragen werden. Die Daten konnen 
so lange von keiner KR/IKR mit anderer ID benutzt. 
werden, bis die die Daten benutzende KR/IKR die Daten 
zuruckgeschrieben (vgl. Write-Back-Methode nach dem 
Stand der Technik) und ihre ID geloscht hat . . . 

Figur 20 zeigt ein Ausfuhrungsbeispiel : 
In Figur 20a fordert die CT 2007 Daten von der 
dariiberliegenden CT an, diese fordert die Daten von der 
ROOT-CT 2004; mit der Datenanf orderung wird die ID der 
Anfordernden KR/IKR (2001) iibertragen. Die Daten (2002) 
werden an 2007 gesendet. Alle anderen, spateren Zugriffe 
werden abgewiesen (2003) . 

In Figur 20b werden die Daten zuriickgeschrieben (2005) , 
anderen, spateren Zugriffe werden wieder akzeptiert 
(2006). 

In Figur 20c werden Daten von einer CT mittleren 
Hierarchie angefordert, im Besitz.der Daten ist und 
diese an 2007 sehdet. Die ID zum Sperren der Daten wird. 
an alle CTs in der Hierarchie gesendet (2001) . Beim 
Riickschreiben der Daten (Write-Back) in Figur 20d werden 
die Daten an alle CTs in der Hierarchie geschrieben und 
die ID geloscht. 

Figur 21 zeigt die Kommunikation einer INITIATOR CT 
(2101) iiber mehrere Zwischen-CTs (2104, 2105, 2106) mit 
einer TARGET CT (2102), sowie die direkte Kommunikation 
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ohne Zwischenebenen mit einer TARGET CT (2103) nach dem 
GETCTS/LOOSECTS-Verfahren. 

2101 baut eine Verbindung zu 2103 auf. Nach 

erf olgreicheri. Aufbau 2101 von 2103 .einen GRANT 

als. Bestatigung des Aufbaus . Danach baut 2101 uber 2104, 
2105, 2106 die Verbindung zu 2102 auf. Die Verbindung zu 

2102 wird erst bestatigt (GRANT), wenn 2102 erreicht 
ist • 

1st die Verbindung nicht aufbaubar, da einer der Busse 
belegt ist, wird ein REJECT an 2101 gesendet und 210.1 
bricht den Vorgang ab. Das bedeutet, dafi auch die 
Verbindung zu 2103 abgebrochen wird und ein REJECT an 

2103 gesendet wird. 

Bestatigt 2102 jedoch die Verbindung rait GRANT, sendet 

2101 an 2103 und 2102 eine GO-Befehl, urn gleichzeitig 
2103 und 2102 den gelungenen Busaufbau und die 
Synchonisation zu bestatigen. Durch dieses Protokoll 
sind Daten oder Befehle synchron und deadlockfrei 
libertragbar, da uber GO sichergestellt ist, dafi alle 
TARGET die Befehle korrekt empfangen. 

Figur 22 zeigt den Ablauf der Inter-CT-Koiranunikation 
nach dem GETBUS/LOOSEBUS-Verf ahren, Wahrend im Verfahren 
gem. Fig, 21 die jeweils xibergeordneten CTs die 
steuernde und pribrisierende Aufgabe besitzen, wird die 
Steuerung hier von den Inter-CT-Bussen (2201). 
ubernommen. 

Eine Verbindung zu 2103 wird aufgebaut, indem die 
INITIATOR-CT (2101) ihren lokalen Inter-CT-Bus anfordert 
(2202) . Anforderungen werden bestatigt, wenn der Bus 
frei ist (ACCEPT) oder zuriickgewiesen, wenn der Bus 
belegt ist (REJECT) . Danach sendet sie die Adresse von 

2102 auf den Bus. Gemafi dem Adressierungs schema erkennt 
die Bussysteuerung, dafi die Adresse auBerhalb der 
lokalen Busadressen liegt und baut uber die 
tibergeordnete CT 2104 eine Verbindung zu deren lokalem 
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Bus auf (2203). Da die Adresse von 2102 in dessen 
Adressberej.ch liegt , wird. iiber 2106 die Verbinciung. zum 
lokalen Bus von 2102 aufgebaut (2204). Da 2101 nunmehr 
aileiniger Busmaster 'sSmtlicher^ f^^ " : ; 

. Datenkpmmunikation erf orderlicher Busse . ist> ist .- ; 
sichergestellt, dal5 eine reibungslose deadlockf reie 
Konununi Ration ablauft, da die Kommunikationskanale fiir 
alle anderen CTs gesperrt sind. Auch 2102 und 2103 
konnen die Busse nicht benutzen, da diese in ihrer 
TARGET-^Rolle nur Befehle. empfangen konnen und nur auf 
Anforderung durch den INITIATOR (2101) selbst Daten 
senden konnen. ;■ 

Sobald die Kommunikation beendet ist,. werden die Busse 
durch ein Signal von 2101 abgebaut. 

Trifft 2101 wahrend des Busaufbaus auf einen benutzten 
Bus, wird ein REJECT an 2101 gesendet und 2101 baut die 
Bus syst erne wieder ab und versucht den Aufbau zu einem 
spateren Zeitpunkt erneut. Forderen mehrere CTs 
gleichzeitig denselben Bus an, so ist die tiberliegende 
CT hoher priorisiert (220S) . Damit wird vermieden, daB 
ein weit f ortgeschrittener Busaufbau, der bereits iiber 
mehrere Ebenen lauft von einem noch sehr lokalen 
Busaufbau abgebrochen wird. 

Durch ein erweitertes Protokoll ist es mpglich. im Falle 
eines REJECTS nur die Busse abzubauen, die von dem hoher 
priorisierten Busaufbau benStigt werden. Dies kann zu . 
einer erheblichen Performancesteigerung fiihren/ da nicht 
alle Busse zu einem spSteren Zeitpunkt neu aufgebaut 
werden miissen. 

Der Aufbau des Inter-CT-Busses fur das Verfahren gem. 
Fig, 22 ist in Figur 23 dargestellt. Die CTs 2301-2304 
sind iiber ihre Interface (2308-2311) zusammen mit der 
iibergeordneten CT 2305 (Interface 2307) an den Inter-CT- 
Bus 2312 angeschlossen. Die Aufschaltung auf den Inter- 
CT-Bus geschieht iiber einen Round-Robin-Arbiter, der 
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2308-2311 gleich priorisiert und 2307 hoher priorisiert, 
der einen Multiplexer zum Zusainmenschalten der Busse 
ansteuert (2306) • Dem Arbiter zugeordnet ist ein 
Statemachine, die die Steuersignale (z-B» Auf/Abbau/ . 
ACCEPT, REJECT.....-) auswertet . . 

Figiir 24 zeigt den Aufbau des Adresschemas eines 
eindimensionalen CT-Baumes. Die Rechtecke symbolisieren 
eine CT. Dabei ist die Adresse der CT eingetragen. - 

kennzeichnet unrelevante Adressbits, die.nicht . . 

ausgewertet werden, die relevanten Adressbits sind mit 
binarer 0 oder 1 angegeben, * steht fiir jedes beliebige 
Adressbit.. Es ist leicht nachvollziehbar, dafi durch . 
Pro jektion dieses Schema auf mehrdimensionale Baume 
ebenso angewendet werden kann, dabei stellen die 
angegebenen Adressen jeweils eine der Achsen dar; mit 
anderen Worten, pro Achse existiert ein entsprechendes 
separates Adressystem. 

Figur 24a zeigt die Adressierung von CT 0001 aus. Dabei 
ist die relative Adresse -1 angegeben. Durch die 
Berechnung -1+1 = 00 ("relative Bewegung" + "Adresse 
der INITIATOR-CT auf aktueller Ebene"), kann die CT 0000 
berechnet werden, die auf denselben lokalen Bus 
geschaltet ist. 

in Figur 24b ruft die CT 0010 die relative Adresse +10 
auf. Die Berechnung 10+0 = 10 ("relative Bewegung" + . 
"Adresse der INITIATOR-CT auf aktueller Ebene") -ergibt. . 
den iibertrag 1, da der Adressbereich des niedersten 
lokalen Busses genau ein Bit breit ist. Dadurch wird der 
nachst hShere Bus selektiert. Dessen Adressberechnung 
ergibt mit 10+10 = 100 ("relative Bewegung" + "Adresse 
der INITIATOR-CT auf aktueller Ebene") erneut einen 
Ubertrag, da dessen Adressbereich mit 2 Bit urn genau 
eins grofier ist, als der Adressbereich des niedersten 
Busses. Auf der nachsthoheren Ebene tritt bei der 
Berechnung 10 + 010 = 0100 kein Ubertrag auf, sodafi das 
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3. Bit (von links) den Pfad 1** mit der nachst tieferen 
Ebene adressiert:, das 2. Bit (yon links) deh Pfad 10* 
der wiederum nachst niedersten Ebene adressiert und 
. schTieBlich das ietzte Bit die ,TARGET-CT selektiert . 
Figur 24c zeigt das bekannt Verfahren uber 2 Ebenen in 
positive Richtung und Figur 24d zeigt das Verfahren uber 
drei Ebenen in negativer Richtung mit negativem 
Uberlauf. 

. ^^9^^ .25 zeigt den Aufbau eines .2-dimensionalen . CT- 
Baumes. Auf der untersten Ebene (2502) befinden sich 2- 
dimensional angeordnet die CTs (2501) . Die Adresse der . 
Dimension ist. mit x/y in der jeweiligen CT angegeben. 
2502 uberigeordhet ist die nachsthohere Ebene (2504). 
Deren CTs (2503) steuern jeweils eine Gruppe von 4 CTs 
der Ebene 2502. Der Adressraum der CTs auf 2504 ist um 
ein Bit weiter, * kennzeichnet die Adressbits der Ebene 
2502, die fiir die Selektion der CTs auf 2504 irrelevant 
sind. 2504 iibergeordnet befindet sich die ROOT-CT 2505, 
Deren Adresse ist wiederum um ein Bit weiter, die 
Bedeutung von * ist Equivalent. 

Figur 26 zeigt die Verkettung des Garbage-Kollektors bei 
der Mikrokontroller-Implementierung. Dabei sind 
samtliche KRs miteinander tiber die Headereintrage 

(garbage-previous /garbage-next ) miteinander verkettet . 
Beim Durchlaufen des Garbage-Kollektors durch die Liste, 
wird das Alter der KR durch Erhohen des Eintrages um 

(+1) ftir die Cache-Statistik (2602) protokolliert . Der 
Garbage-Kollektor achtet auf den Eintrag KR-Statistik 

(2601), der anzeigt, ob die KR noch in der FILMO-Liste 
hangt. In diesem Fall darf die KR nicht von GC geloscht 
werden, da sie noch unkonf igurierte KW enthalt. 
Alternativ konnte dieser Test auch iiber die Eintrage 
FILMO-next und FILMO-previous ablaufen. 
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In Figur 27 ist die Verkettung der FILMO-Liste 
dargestellt. 

Dabei kann die Verkettung eine vollkommen andere als in 
der Gkrbage-Liste (Fig. -26) sein. Die KRs sind iiber 
FILMO-preyious und FILMO-ne.xt yerJcettet . Die Eint rage . 
KR-Statistik (2701) zeigen auf das jeweils erste noch 
nicht konfigurierte KW in der jeweiligen KR. Ein FILMO- 
Lauf gestaltet sich derart, daB in der ersten ID die KR 
gestartet wird. Nach Ausfuhrung wird die Position des 
nicht ausgefiihrten KW nach .2.701 geschrieben. Sollte KR 
komplett ausgefiihrt wor den sein, wird das KR aus der 
verketteten FILMO-Liste entfernt, verbleibt .aber im 
Speicher. Danach wird iiber die FILMO-Liste . zu. dem 
nachsten KR gesprungen^ das ebenso verarbeitet wird. 

Figiir 28 verdeutlicht den Aufbau einer KR bei 
Mikrokontrollersteuerung. Zu Beginn steht ein 
Sprungbefehl, der hinter den Header (2801) der KR 
springt. Jedem KW zugeordnet ist das FILMO-Bit (2802). 
Eine 1 (2803) zeigt an, daii das KW von den CEL 
akzeptiert wurde (ACCEPT) und beim nachsten Durchlauf 
nicht mehr ausgefiihrt wird. Eine 0 (2804) zeigt einen 
REJECT an, das KW mufi beim nachsten Durchlauf erneut 
ausgefiihrt werden. Die optionale KR-Statistik (2701) 
zeigt auf das erste mit 0 gekennzeichente KW. Erhalt 
PUSHRET (2805), einen REJECT, wird die Abarbeitung. des KR 
hier abgebrochen und beim nachsten Durchlauf eritweder 
beim ersten KW oder an der Stelle auf die 2701 zeigt neu 
aufgesetzt. Ansonsten wird das KR an dessen Ende bei 
2806 ordentlich verlassen. 

Figur 29 zeigt die Schaltung zum Sichern der 
Statusinformationen einer CEL vor dem Durchlaufen des 
FILMOs Oder Starten einer KR. Die Statusinformation 
gelangt aus der CEL (2901) auf ein Register (2902). Vor 
dem Durchlaufen des FILMOs oder Starten einer KR sendet 



62 



wo 99/44147 



PCT/DE99/00504 



die CT ein Freigabesignal (2903) an 2902. Daraufhin wird. 
die Statusinformation iibernoramen und an di-e CXT . . . - 
weitergeleitet (2904). 2904 bleibt konstant bis zum 
naclisten Absenden von 2903. - . 
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Begriffsdefihition 

ACCEPT Signal, das anzeigt, dafi die adressierte CEL 
sich in einem kohf igtirierbareh Zustand befihdet urid das 
gesendete KW anniinmt . 

Block-Befehle (u. a. BLOCK-MOVE) Befehle, die eine 
Mehrzahl von Daten (einen Block) im Speicher oder 
zwischen Speicher und Peripherie verschieben. Dabei wird 
die Herkunftsadresse der zu verschiebenden Daten, die 
Zieladresse der Daten und die LSnge das Datenblocks 
angeben . - 

Broadcast Senden einer Information an eine Vielzahl 

von Empfangern. 

Datenenqpf anger Die Einheit(en), die Ergebnisse der 

CEL weiterverarbeitetZ-arbeiten 

Datensender Die Einheit(en), die Daten fiir die CEL 
als Operanden zur Verfugung stellt/stellen 

Datenwort Ein Datenwort besteht aus einer beliebig 

lapgen Bit-Reihe. Diese. Bit-Reihe stellt eine 
Verarbeitungseinheit fur eine Anlage dar. In einem 
Datenwort kSnnen sowohl Befehle fur Prozessoren o.a. 
Bausteine . spwie. rein Daten kodiert w 

Deadlock Zustand, indem aufgrund gegenseitiger 

Blockade keinerlei Datenverarbeitung moglich ist, 

DFP DatenfluBprozessor nach Patent /Of fenlegung DE 

44 16 881 

DPGA Dynamisch konf igurierbare FPGAs. Stand der 

Technik 
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Blemente Santmelbegrif f fur . alle Arten . yon . in^ sich 

abgeschlossenen Einheiten, welche als Stuck in einem 
elektronischen Baustein zum Eihsatz kommen konnen. 
Elemente sind also: 

- Konfigurierbare Zellen aller Art 

- Cluster 

- RAM-Blocke 

- Logik 

- Rechenwerke, ^ 

- Register 

r- Multiplexer . - :• . . 

- I/O. Pins eines. Chips ... 

Ereignis Ein Ereignis kann durch ein 

Hardwareelement in irgendeiner zur Anwendung passenden 
Art und Weise ausgewertet werden und als Reaktion auf 
diese Auswertung eine bedingte Aktion auslosen. 
Ereignisse sind somit zum Beispiel: 

- Taktzyklus einer Rechenanlage . 

- internes oder externes Interrupt-Signal, 

- Trigger-Signal von anderen Elementen innerhalb des 
Bausteines - 

Vergleich eines Datenstroms und/oder eines 
Befehlstroms mit einem Wert. 

- Input /Output Ereigenisse, 

- Ablaufen, iiberlaufen, neusetzen etc . eines . Zahlers. 

- Auswerten eines Vergleichs. 

FIFO First-In, First-Out Speicher nach dera Stand 

der Technik 

FILMO Abgewandeltes FIFO, aus dem linear Daten 
gelesen werden. Eine Beschrankung des Lesezeigers auf 
den Beginn des Speichers ist nicht vorhanden. 
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FPGA Progranuotiierbarer Logikbaustein. Stand der 

Technik. 

F-PLUREG Register in dem die Funktion der CEL gesetzt 
wird. Ebenfailis wird der OneShot- iind Sleep-Mode 
gesetzt. Das Register wird von der PLU beschrieben. 

Fragxnentierung Zerteilen von Speicher in eine 

Vielzahl oftmals kleiner und damit nutzloser 
Speicherbereiche . 

Garbage-Kollektor Einheit zum Verwalten des Speichers . 
Verhindert eine Fragmentierung. 

H-Pegel Logisch 1 Pegel/ abhangig von der verwendeten 
Technologie 

HOST Einem Baustein oder Baugruppe iibergeordneter 

Rechner. 

IDLE-Zyklus Zyklus, in dem eine Statemachine keine 
Verarbeitung durchfiihrt. Grundzustand einer 
Statemachine • 

. INITER-CT-BUS Bussystem zwischen den CTs einer Ebene 
und einer hSherliegenden CT (oder CT-Gruppe) . 

•INITIATOR CT, die einen . Zugrif f - auf den Inter-CT- 

Bus startet. 

Pointer Zeiger auf eine Adresse bzw. ein 

Datenwort . 

konfigurierbares Element (KE) Ein konf igurierbares 

Element stellt eine Einheit eines Logik-Bausteines dar, 
welche durch ein Konf igurationswort fur eine spezielle 
Funktion eingestellt werden kann, Konf igurierbare 
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Elemente sind somit, alle Arten von RAM Zellen, 
Multiplexer, Arithmetische logische Einheiten, Register 
und alle Arten von interner und externer 
Vernet2uhg'sbe3chreibu etc.) V 

konfigurierbare Zelle (CEL) Siehe Logikzellen 

Konfigurieren Einstellen der Funktion und 

Vernetzung einer logischen Einheit, einer {FPGA)-Zelle 
Oder einer CEL (vgl . umkonf igurieren) . \ 

Konfigurationsdaten , Beliebige Menge von 
Konf igurationswprten . . 

Konfigurationsroutine (KR) Mehrere Konf igur at ions wort e 
zu einem Algorithmus zusanmiengefugte. 

Konfigurationsspeichor Der Konf igurationspeicher 

enthalt ein oder mehrere Konfigurationsworte. 

Konfigurationswort (KW) Ein Konf igurationswort 

besteht aus einer beliebig langen Bit-Reihe. Diese Bit- 
Reihe stellt eine giiltige Einstellung fur das zu 
konfigurierende Element dar, so das eine funktionsf.ahige 
Einheit entsteht/ 

Ladelogik Einheit zum Konfigurieren und 

Umkonf igurieren der CEL. Ausgestaltet durch einen 
speziell an seine Aufgabe angepafiten Mikrokontroller . 

Logikzellen Bei DFPs, FPGAs, DPGAs verwendete 
konfigurierbare Zellen, die einfache logische oder 
arithmetische Aufgaben gemSB ihrer Konfiguration 
erfiillen. 
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Lookup-Tabelle Stand der Technik. Verfahren zum 

Ubersetzen von Daten. 

LUTl Lbokup-Tabelle, die einen Trigger auf eine ID 

ubersetzt und feststellt, . ob der Trigger, einer giiltigen 
ID zugeordnet ist. 

LUT2 Lookup-Tabelle, die eine ID auf die Adresse 

der entsprechenden KR im lokalen Speicher ubersetzt und 
feststellt, Ob die KR im lokalen Speicher yorhanden. ist . 

L-Pegel Logisch 0 Pegel, abhangig yon der yerwendeten 
Technologie ... 

Maske Bitkorabination, die die giiltigen Signale 
innerhalb einer Mehrzahl von Signalen angibt. 

Priorisierung Festlegung einer Reihenfolge. 

RECONFIG Rekonfigurierbarer Zustand einer CEL. 

RECONFIG-Trigger Setzen einer CEL in den 
rekonf igurierbaren Zustand. 

REJECT Signal, das anzeigt, dali die adressierte CEL 
sich in einem nichtkonf igurierbaren Zustand. befindet 
und das gesendete KW. nicht. anhimmt../ 

REMOVE-<ID> 1. Befehl innerhalb eines KR zum 
Entfernen der durch ID ref erenzierten KR. 
2. Befehl einer iibergeordneten CT iiber ein separates 
Interface Oder Handshaking an eine untergeordnete CT zum 
loschen der durch ID ref erenzierten KR. 

RESET Rucksetzen eines Bausteiries oder eines ganzen 
Computersystems in einen definierten Grundzustand. 
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ROOT-CT CT. der hochsten Hiejfarchieebene mit direktem . 
Zugriff auf den externen Konfigurationsspeicher . 

Round-^Robin-Arbiter Arbiter der im Kreis lauft .und 

iinmer dem zuletzt arbitrierten Signal die niederste 
Prioritat zuordnet. 

Statemachine siehe Zustandsmaschine . 

Synchronisationssignale Statussignale die von einem 

konfigurierbaren Element oder einem Rechenwerk generiert 

werden. und zur Steuerung und Synchronisation der • 
Datenverarbeitung an weitere konf igurierbare Element 
Oder Rechenwerke weitergeleitet werden. Es ist auch 
moglich ein Synchronisationssignal zeitlich verzogert 
(gespeichert) an ein und dasselbe konf igurierbare 
Element oder Rechenwerk zurtickzuleiten. 

TARGET CT, die einen Ziel eines Zugriffs auf den 

Inter-CT-Bus ist. 

Trigger Synonym fiir Synchronisationssignale. 

X^ohfigurieren Neues Konf igurieren von einer 
beliebigen Menge von CELs wShrend eine beliebige 
Restmehge von CELs ihre eigehen Funktionen f ortsetzen 
(vgl, konf igurieren) . 

Verkettete-Liste Uber Pointer zusammengefugte 
Datenstruktur nach dem Stand der Technik. 

Zellen Synonym fur konf igurierbare Elemente 

Zustandsmaschine Logik, die diversen Zustanden 

annehmen kann. Die Ubergange zwischen den Zustanden 
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sind von verschiedenen Eingangsparametern abhangig, 
Diese Maschinen werden zur Steuerung komplexer. . ... 
Funktionen eingesetzt und entsprechen dem Stand der 
Techhikr ' * " " ' 
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Patentanspruche . 

1. Verfahren zum Cachen von Befehlen in aus mehrereri 
Rechenwerk^sn- bestehenden Mikroproz.essoren uhd in . . 
Bausteinen mit zwei- oder mehrdimensionaler 
Zellanordnung (z.B. FPGAs, DPGAs, DFPs, o.dgl,), dadurch 
gekennzeichnet, dafi 

1.1 mehrere Zellen und Rechenwerke (CEL) .. zu einer 

Mehrzahl von Gruppen zusanimengefaJit werderi, 
wobei jeder Teilgruppe eine Cache-Einheit (CT) 
zugeordnet ist,' ' 

1.2 die Cache-Einheiten; der einzelnen Teilgruppeh 

werden uber eine Baumstruktur an eine 
ubergeordnete Cache-Einheit (ROOT-CT) 
geschaltet, die Zugriff auf den 
Befehlsspeicher Speicher (ECR) besitzt, in dem 
die Befehle abgelegt sind, 

1.3 Befehle werden zu Befehlssquenzen (KR) 

zusammengef afit, die iitimer als ganze gecachet 
und zwischen den Caches iibertragen werden, 

1.4 jede Cache-Einheit auf unterster oder mittlerer 

Ebene des Baumes fordert die benotigten 
. Befehle bei der jeweils iibergeordneten Cache- 
Einheit an, 

1.5 eine iibergeordnete Cache-Einheit sendet eine 

angefordeften Befehlssequenzen an die^^ 
untergeordnete Einheit, sofern sie die 
Befehlssequenzen in ihrem lokalen Speicher 
halt, 

1.6 eine ubergeordnete Cache-Einheit fordert eine 

angeforderten Befehlssequenzen bei der ihr 
iibergeordneten Cache-Einheit an, sofern sie 
die Befehlssequenzen nicht in ihrem lokalen 
Speicher halt. 
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2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, 
daU 

Befehlssequenzen als Ganze geloscht werden. 

3. Verfahren nach Anspruch l.bis 2,. dadurch, 
gekennzeichnet, dafi 

Befehlssequenzen einer Cache-Einheit geloscht werden, 
wenn nicht geniigend Platz zum Laden einer weiteren 
angeforderten Befehlssequenz im lokalen Speicher 
vorhanden ist . 

4. V.erfahreii nach Anspruch 1 bis. 2, dadurch. 
gekennzeichnet, daft 

ein Befehl (REMOVE) innerhalb einer Befehlssequenz einen 
Vorgang auslost, durch den Befehlssequenzen einer Cache- 
Einheit geloscht werden. 

5. Verfahren nach Anspruch 1 bis 4, dadurch 
gekennzeichnet , daft 

ein Befehl (EXECUTE) innerhalb einer Befehlssequenz das 
Laden einer bestimmten kompletten Befehlssequenz 
auslost . 

6. Verfahren nach Anspruch 1 bis 5, dadurch 
gekennzeichnet, daft 

ein beliebiger Befehl (EXECUTE, REMOVE, etc.) uber eine 
Busverbindung zwischen den Cache-Einheiten eine.dein . 
Befehl entsprechende Aktion auf einer bliebigen 
adressierten Cache-Einheit auslost . 

7.. Verfahren nach Anspruch 1 bis 6, dadurch 
gekenn z eichnet , dafi 

eine Programmsequenz, die nicht effektive cachebar ist, 
da diese nur von einer Cache-Einheit verwendet wird, in 
kleine Teilsequenzen zerlegt wird, die von mehreren 
Cache-Einheiten benotigt werden, eine weitere 
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Teilsequenz (IKR) enthait den nicht cachebaren Rest der 
Befehlssequenz urid die Aufrufe der cachebaren 
• Teilse'qulehzen.' ■' 

8. Verfahren nach Anspruch.l bis 7, dadurch. ... 
gekennzeichhet, dafi 

jeder Befehlssequenz eine Statistik zugeordnet ist, die 
infonnationen fiber das Alter, d.h. der Verweildauer im 
Speicher der Cache-Einheit, der Befehlssequenz gibt. 

9. Verfahren nach Anspruch 1 bis 7, dadurch 

gekennzeichnet, daB 

jeder Befehlssequenz eine Statistik zugeordnet ist> die 
Informationen uber die Hauf igkeit der Aufrufe der 
Befehlssequenz gibt. 

10. Verfahren nach Anspruch 1 bis 7, dadurch 
gekennzeichnet, dafi 

jeder Befehlssequenz eine Statistik zugeordnet ist, die 
Informationen iiber die LSnge der Befehlssequenz gibt. 

t1. Verfahren nach Anspruch 1 bislO, dadurch 
gekennzeichnet, dafi 

die LSschroutine so ausgelegt ist, dafi sie die Statistik 

Deder Befehlssequenz auswertet und die entsprechend des 

ausgefUhrten Algbrithmuses unwichtlgste Befehlssequenz 
entfernt.. . . . • T 

12. Verfahren nach Anspruch 1 bis 11, dadurch 
gekennzeichnet, dafi 

die LSschroutine an den auszufiihrenden Algorithmus 
prograiranierbar anpassbar ist. 
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